使用Html Agility Pack從HTML BODY節點提取內部文本

c# html html-agility-pack vb.net

需要一些HTML Agility Pack的幫助!

基本上我想用HTML的正文節點獲取純文本 。到目前為止,我已經在vb.net中嘗試了這個並且它無法返回innertext意味著沒有看到任何變化,至少從我能看到的內容。

Dim htmldoc As HtmlDocument = New HtmlDocument
htmldoc.LoadHtml(html)

Dim paragraph As HtmlNodeCollection = htmldoc.DocumentNode.SelectNodes("//body")

If Not htmldoc Is Nothing Then
   For Each node In paragraph
       node.ParentNode.RemoveChild(node, True)
   Next
End If

Return htmldoc.DocumentNode.WriteContentTo

我試過這個:

Dim htmldoc As HtmlDocument = New HtmlDocument
htmldoc.LoadHtml(html)

Dim paragraph As HtmlNodeCollection = htmldoc.DocumentNode.SelectNodes("//body")

If Not htmldoc Is Nothing Then
   For Each node In paragraph
       node.ParentNode.RemoveChild(node, True)
   Next
End If

Return htmldoc.DocumentNode.WriteContentTo

但還是沒有運氣!

任何建議???

熱門答案

怎麼樣:

Return htmldoc.DocumentNode.SelectSingleNode("//body").InnerText



許可下: CC-BY-SA with attribution
不隸屬於 Stack Overflow
這個KB合法嗎? 是的,了解原因
許可下: CC-BY-SA with attribution
不隸屬於 Stack Overflow
這個KB合法嗎? 是的,了解原因