Estrazione di una tabella con il pacchetto di agilità HTML

html html-agility-pack vb.net web-scraping

Domanda

Sto cercando di estrarre una tabella da una pagina Web utilizzando Html Agility Pack. Finora sono riuscito a fare un po 'di progressi con esso. Questo è il mio codice finora

    Dim web As New HtmlAgilityPack.HtmlWeb()
    Dim htmlDoc As HtmlAgilityPack.HtmlDocument = web.Load("--Website url--")
    Dim html As String = htmlDoc.DocumentNode.OuterHtml

    Dim tabletag = htmlDoc.DocumentNode.SelectNodes("//table")

Fondamentalmente ho bisogno di trovare una tabella con il seguente tag html

    Dim web As New HtmlAgilityPack.HtmlWeb()
    Dim htmlDoc As HtmlAgilityPack.HtmlDocument = web.Load("--Website url--")
    Dim html As String = htmlDoc.DocumentNode.OuterHtml

    Dim tabletag = htmlDoc.DocumentNode.SelectNodes("//table")

Qualche idea su come posso spogliare la mia ricerca di tabelle per quel tavolo specifico?

Risposta accettata

È necessario determinare di cosa si tratta sulla tabella che lo rende unico tra tutte le tabelle nel documento. Potrebbe essere uno di quegli attributi della tabella, come l'attributo di summary che lo rende unico. Oppure, potrebbe essere uno dei suoi elementi figlio all'interno del tavolo che devi cercare. Dato che non hai specificato, mostrerò un esempio di come limitare i risultati in base all'attributo di summary :

Dim tabletag = htmlDoc.DocumentNode.SelectNodes("//table[@summary='Contains search results']")



Autorizzato sotto: CC-BY-SA with attribution
Non affiliato con Stack Overflow
È legale questo KB? Sì, impara il perché
Autorizzato sotto: CC-BY-SA with attribution
Non affiliato con Stack Overflow
È legale questo KB? Sì, impara il perché