analyse des liens et des tableaux à l'aide de VB.net HTML AgilityPack

.net html-agility-pack vb.net

Question

J'essaie de rayer l'écran et j'ai découvert le HTML AgilityPack, mais j'ai du mal à comprendre comment l'utiliser avec VB.net.

La première chose que je veux faire est de trouver la chaîne d'URL pour une balise HREF si je connais le texte qui est inclus dans le HREF.

La deuxième chose que je veux faire est d’analyser un tableau HTML, en parcourant chaque ligne et en extrayant les données afin que je puisse les sauvegarder dans une base de données (après une analyse élémentaire).

Réponse acceptée

Voici un bon lien de départ ici sur SO: Comment utiliser le pack HTML Agility

Voir aussi ceci: Exemple HtmlAgilityPack pour changer les liens ne fonctionne pas. Comment puis-je accomplir cela?

Et ceci: Trouver toutes les URL A HREF dans un document HTML (même si du HTML malformé)

Pour trouver un fichier HREF spécifique, la syntaxe xpath serait "// a [@ href = 'votre URL"] ", ce qui signifie:" obtenez toute balise A possédant un attribut HREF égal à "votre URL".

MODIFIER:

Pour rechercher un HREF si vous ne connaissez que le texte, par exemple si vous avez le texte html ' <a href="homepage.html">Cars</a> ' et cherchez homepage.html, <a href="homepage.html">Cars</a> il.

        string s = @"<a href=""homepage.html"">Cars</a>";

        HtmlDocument doc = new HtmlDocument();
        doc.LoadHtml(s);

        HtmlNode node = doc.DocumentNode.SelectSingleNode("//a[text()='Cars']");
        Console.WriteLine("href=" + node.GetAttributeValue("href", null));



Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow
Est-ce KB légal? Oui, apprenez pourquoi
Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow
Est-ce KB légal? Oui, apprenez pourquoi