Html 민첩성 팩으로 HTML BODY 노드에서 내부 텍스트 추출하기

c# html html-agility-pack vb.net

문제

HTML Agility Pack에 대한 약간의 도움이 필요합니다!

기본적으로 HTML의 본문 노드를 사용하여 일반 텍스트 를 가져 오려고합니다. 지금까지 나는 vb.net에서 이것을 시도했지만, 변화가 없다는 것을 의미하는 innertext를 반환하지 못한다.

Dim htmldoc As HtmlDocument = New HtmlDocument
htmldoc.LoadHtml(html)

Dim paragraph As HtmlNodeCollection = htmldoc.DocumentNode.SelectNodes("//body")

If Not htmldoc Is Nothing Then
   For Each node In paragraph
       node.ParentNode.RemoveChild(node, True)
   Next
End If

Return htmldoc.DocumentNode.WriteContentTo

나는 이것을 시도했다.

Return htmldoc.DocumentNode.InnerText

그러나 아직도 운이 없다!

어떤 충고???

인기 답변

어때?

Return htmldoc.DocumentNode.SelectSingleNode("//body").InnerText


Related

아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow