Html Agility Packを使用したHTML BODYノードからの内部テキストの抽出

c# html html-agility-pack vb.net

質問

HTMLアジャイルパックで少し助けが必要です!

基本的には、HTMLの本体ノードを使ってプレーンテキストを取得したいと考えています。これまで私はvb.netでこれを試しましたが、変化が見られないことを意味するinnertextを返すことに失敗しました。

Dim htmldoc As HtmlDocument = New HtmlDocument
htmldoc.LoadHtml(html)

Dim paragraph As HtmlNodeCollection = htmldoc.DocumentNode.SelectNodes("//body")

If Not htmldoc Is Nothing Then
   For Each node In paragraph
       node.ParentNode.RemoveChild(node, True)
   Next
End If

Return htmldoc.DocumentNode.WriteContentTo

私はこれを試した:

Return htmldoc.DocumentNode.InnerText

しかし、まだ運がない!

何かアドバイス???

人気のある回答

どのように:

Return htmldoc.DocumentNode.SelectSingleNode("//body").InnerText


Related

ライセンスを受けた: CC-BY-SA with attribution
所属していない Stack Overflow
このKBは合法ですか? はい、理由を学ぶ
ライセンスを受けた: CC-BY-SA with attribution
所属していない Stack Overflow
このKBは合法ですか? はい、理由を学ぶ