Html 민첩성 팩으로 HTML BODY 노드에서 내부 텍스트 추출하기

c# html html-agility-pack vb.net

문제

HTML Agility Pack에 대한 약간의 도움이 필요합니다!

기본적으로 HTML의 본문 노드를 사용하여 일반 텍스트 를 가져 오려고합니다. 지금까지 나는 vb.net에서 이것을 시도했지만, 변화가 없다는 것을 의미하는 innertext를 반환하지 못한다.

Dim htmldoc As HtmlDocument = New HtmlDocument
htmldoc.LoadHtml(html)

Dim paragraph As HtmlNodeCollection = htmldoc.DocumentNode.SelectNodes("//body")

If Not htmldoc Is Nothing Then
   For Each node In paragraph
       node.ParentNode.RemoveChild(node, True)
   Next
End If

Return htmldoc.DocumentNode.WriteContentTo

나는 이것을 시도했다.

Dim htmldoc As HtmlDocument = New HtmlDocument
htmldoc.LoadHtml(html)

Dim paragraph As HtmlNodeCollection = htmldoc.DocumentNode.SelectNodes("//body")

If Not htmldoc Is Nothing Then
   For Each node In paragraph
       node.ParentNode.RemoveChild(node, True)
   Next
End If

Return htmldoc.DocumentNode.WriteContentTo

그러나 아직도 운이 없다!

어떤 충고???

인기 답변

어때?

Return htmldoc.DocumentNode.SelectSingleNode("//body").InnerText



아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.
아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.