Extraire une table avec Html Agility Pack

html html-agility-pack vb.net web-scraping

Question

J'essaie d'extraire une table d'une page Web à l'aide de HTML Agility Pack. Jusqu'à présent, j'ai réussi à progresser un peu. C'est mon code jusqu'à présent

    Dim web As New HtmlAgilityPack.HtmlWeb()
    Dim htmlDoc As HtmlAgilityPack.HtmlDocument = web.Load("--Website url--")
    Dim html As String = htmlDoc.DocumentNode.OuterHtml

    Dim tabletag = htmlDoc.DocumentNode.SelectNodes("//table")

Fondamentalement, je dois trouver une table avec la balise html suivante

     <table width="100%"  border="0" cellspacing="0" cellpadding="3" summary="Contains search results">

Une idée de comment je peux arracher ma recherche de tables à cette table spécifique?

Réponse acceptée

Vous devez déterminer en quoi la table est unique et qui la rend unique parmi toutes les tables du document. Il peut s'agir de l'un de ces attributs de la table, tel que l'attribut summary qui la rend unique. Ou bien, il peut s'agir de l'un de ses éléments enfants à l'intérieur de la table que vous devez rechercher. Comme vous n'avez pas spécifié, je vais vous montrer un exemple de limitation des résultats en fonction de l'attribut summary :

Dim tabletag = htmlDoc.DocumentNode.SelectNodes("//table[@summary='Contains search results']")


Related

Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow
Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow