Estrazione del testo interno dal nodo HTML BODY con Html Agility Pack

c# html html-agility-pack vb.net

Domanda

Hai bisogno di un po 'di aiuto con HTML Agility Pack!

Fondamentalmente voglio prendere testo in chiaro con il nodo del corpo dell'HTML. Finora ho provato questo in vb.net e non riesce a restituire il testo interiore, il che significa che non si vede alcun cambiamento, ma almeno da quello che posso vedere.

Dim htmldoc As HtmlDocument = New HtmlDocument
htmldoc.LoadHtml(html)

Dim paragraph As HtmlNodeCollection = htmldoc.DocumentNode.SelectNodes("//body")

If Not htmldoc Is Nothing Then
   For Each node In paragraph
       node.ParentNode.RemoveChild(node, True)
   Next
End If

Return htmldoc.DocumentNode.WriteContentTo

Ho provato questo:

Return htmldoc.DocumentNode.InnerText

Ma ancora senza fortuna!

Qualche consiglio ???

Risposta popolare

Che ne dite di:

Return htmldoc.DocumentNode.SelectSingleNode("//body").InnerText


Related

Autorizzato sotto: CC-BY-SA with attribution
Non affiliato con Stack Overflow
È legale questo KB? Sì, impara il perché
Autorizzato sotto: CC-BY-SA with attribution
Non affiliato con Stack Overflow
È legale questo KB? Sì, impara il perché