Html 민첩성 팩으로 HTML BODY 노드에서 내부 텍스트 추출하기

c# html html-agility-pack vb.net

문제

HTML Agility Pack에 대한 약간의 도움이 필요합니다!

기본적으로 HTML의 본문 노드를 사용하여 일반 텍스트 를 가져 오려고합니다. 지금까지 나는 vb.net에서 이것을 시도했지만, 변화가 없다는 것을 의미하는 innertext를 반환하지 못한다.

Dim htmldoc As HtmlDocument = New HtmlDocument
htmldoc.LoadHtml(html)

Dim paragraph As HtmlNodeCollection = htmldoc.DocumentNode.SelectNodes("//body")

If Not htmldoc Is Nothing Then
   For Each node In paragraph
       node.ParentNode.RemoveChild(node, True)
   Next
End If

Return htmldoc.DocumentNode.WriteContentTo

나는 이것을 시도했다.

Return htmldoc.DocumentNode.InnerText

그러나 아직도 운이 없다!

어떤 충고???

인기 답변

어때?

Return htmldoc.DocumentNode.SelectSingleNode("//body").InnerText


아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.
아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.