Extraer texto interno del nodo HTML BODY con Html Agility Pack

c# html html-agility-pack vb.net

Pregunta

Necesita un poco de ayuda con HTML Agility Pack!

Básicamente quiero capturar texto sin formato dentro del cuerpo del código HTML. Hasta ahora he intentado esto en vb.net y no devuelve el texto interno, lo que significa que no se ve ningún cambio, al menos por lo que puedo ver.

Dim htmldoc As HtmlDocument = New HtmlDocument
htmldoc.LoadHtml(html)

Dim paragraph As HtmlNodeCollection = htmldoc.DocumentNode.SelectNodes("//body")

If Not htmldoc Is Nothing Then
   For Each node In paragraph
       node.ParentNode.RemoveChild(node, True)
   Next
End If

Return htmldoc.DocumentNode.WriteContentTo

He intentado esto:

Return htmldoc.DocumentNode.InnerText

¡Pero aún no hay suerte!

¿¿¿Algún consejo???

Respuesta popular

Qué tal si:

Return htmldoc.DocumentNode.SelectSingleNode("//body").InnerText


Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow
¿Es esto KB legal? Sí, aprende por qué
Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow
¿Es esto KB legal? Sí, aprende por qué