Extrahieren einer Tabelle mit Html Agility Pack

html html-agility-pack vb.net web-scraping

Frage

Ich versuche mithilfe von Html Agility Pack eine Tabelle aus einer Webseite zu extrahieren. Bis jetzt ist es mir gelungen, ein wenig Fortschritte zu machen. Das ist bisher mein Code

    Dim web As New HtmlAgilityPack.HtmlWeb()
    Dim htmlDoc As HtmlAgilityPack.HtmlDocument = web.Load("--Website url--")
    Dim html As String = htmlDoc.DocumentNode.OuterHtml

    Dim tabletag = htmlDoc.DocumentNode.SelectNodes("//table")

Grundsätzlich muss ich eine Tabelle mit folgendem HTML-Tag finden

     <table width="100%"  border="0" cellspacing="0" cellpadding="3" summary="Contains search results">

Irgendeine Idee, wie ich meine Suche nach Tabellen auf diese bestimmte Tabelle strippen kann?

Akzeptierte Antwort

Sie müssen bestimmen, was es mit der Tabelle zu tun hat, die es unter allen Tabellen im Dokument eindeutig macht. Es kann eines dieser Attribute der Tabelle sein, z. B. das summary , das es eindeutig macht. Oder es ist eines der untergeordneten Elemente in der Tabelle, nach denen Sie suchen müssen. Da Sie nicht angegeben haben, zeige ich Ihnen ein Beispiel, wie Sie die Ergebnisse basierend auf dem summary einschränken können:

Dim tabletag = htmlDoc.DocumentNode.SelectNodes("//table[@summary='Contains search results']")


Lizenziert unter: CC-BY-SA with attribution
Nicht verbunden mit Stack Overflow
Ist diese KB legal? Ja, lerne warum
Lizenziert unter: CC-BY-SA with attribution
Nicht verbunden mit Stack Overflow
Ist diese KB legal? Ja, lerne warum