Extraer una tabla con Html Agility Pack

html html-agility-pack vb.net web-scraping

Pregunta

Estoy tratando de extraer una tabla de una página web usando Html Agility Pack. Hasta ahora he logrado avanzar un poco con ello. Este es mi código hasta ahora

    Dim web As New HtmlAgilityPack.HtmlWeb()
    Dim htmlDoc As HtmlAgilityPack.HtmlDocument = web.Load("--Website url--")
    Dim html As String = htmlDoc.DocumentNode.OuterHtml

    Dim tabletag = htmlDoc.DocumentNode.SelectNodes("//table")

Básicamente necesito encontrar una tabla con la siguiente etiqueta html

    Dim web As New HtmlAgilityPack.HtmlWeb()
    Dim htmlDoc As HtmlAgilityPack.HtmlDocument = web.Load("--Website url--")
    Dim html As String = htmlDoc.DocumentNode.OuterHtml

    Dim tabletag = htmlDoc.DocumentNode.SelectNodes("//table")

¿Alguna idea de cómo puedo simplificar mi búsqueda de tablas para esa tabla específica?

Respuesta aceptada

Debe determinar de qué se trata la tabla que la hace única entre todas las tablas del documento. Puede ser uno de esos atributos de la tabla, como el atributo de summary que lo hace único. O bien, puede ser uno de sus elementos secundarios dentro de la tabla que debe buscar. Como no especificó, le mostraré un ejemplo de cómo limitar los resultados según el atributo de summary :

Dim tabletag = htmlDoc.DocumentNode.SelectNodes("//table[@summary='Contains search results']")



Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow
¿Es esto KB legal? Sí, aprende por qué
Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow
¿Es esto KB legal? Sí, aprende por qué