使用Html Agility Pack从HTML BODY节点提取内部文本

c# html html-agility-pack vb.net

需要一些HTML Agility Pack的帮助!

基本上我想用HTML的正文节点获取纯文本 。到目前为止,我已经在vb.net中尝试了这个并且它无法返回innertext意味着没有看到任何变化,至少从我能看到的内容。

Dim htmldoc As HtmlDocument = New HtmlDocument
htmldoc.LoadHtml(html)

Dim paragraph As HtmlNodeCollection = htmldoc.DocumentNode.SelectNodes("//body")

If Not htmldoc Is Nothing Then
   For Each node In paragraph
       node.ParentNode.RemoveChild(node, True)
   Next
End If

Return htmldoc.DocumentNode.WriteContentTo

我试过这个:

Return htmldoc.DocumentNode.InnerText

但还是没有运气!

任何建议???

热门答案

怎么样:

Return htmldoc.DocumentNode.SelectSingleNode("//body").InnerText


许可下: CC-BY-SA with attribution
不隶属于 Stack Overflow
这个KB合法吗? 是的,了解原因
许可下: CC-BY-SA with attribution
不隶属于 Stack Overflow
这个KB合法吗? 是的,了解原因