Ich versuche mithilfe von Html Agility Pack eine Tabelle aus einer Webseite zu extrahieren. Bis jetzt ist es mir gelungen, ein wenig Fortschritte zu machen. Das ist bisher mein Code
Dim web As New HtmlAgilityPack.HtmlWeb()
Dim htmlDoc As HtmlAgilityPack.HtmlDocument = web.Load("--Website url--")
Dim html As String = htmlDoc.DocumentNode.OuterHtml
Dim tabletag = htmlDoc.DocumentNode.SelectNodes("//table")
Grundsätzlich muss ich eine Tabelle mit folgendem HTML-Tag finden
<table width="100%" border="0" cellspacing="0" cellpadding="3" summary="Contains search results">
Irgendeine Idee, wie ich meine Suche nach Tabellen auf diese bestimmte Tabelle strippen kann?
Sie müssen bestimmen, was es mit der Tabelle zu tun hat, die es unter allen Tabellen im Dokument eindeutig macht. Es kann eines dieser Attribute der Tabelle sein, z. B. das summary
, das es eindeutig macht. Oder es ist eines der untergeordneten Elemente in der Tabelle, nach denen Sie suchen müssen. Da Sie nicht angegeben haben, zeige ich Ihnen ein Beispiel, wie Sie die Ergebnisse basierend auf dem summary
einschränken können:
Dim tabletag = htmlDoc.DocumentNode.SelectNodes("//table[@summary='Contains search results']")