HtmlAgilityPack으로 파싱 할 때 공백과 개행 문자를 제거하십시오.

asp.net c# html-agility-pack trim

문제

HTML을 HtmlAgilityPack과 함께 다음과 같이 구문 분석하려고했습니다.

HtmlDocument htmlDoc = new HtmlDocument();
htmlDoc.LoadHtml(xhtmlString);

불행히도 xhtmlString에는 불필요한 공백 문자와 개행 문자가 포함되어 있으므로 htmlDoc의 _text는 다음과 같습니다.

<html xmlns=\"http://www.w3.org/1999/xhtml\">\n\t<head></head>\n\t<body>\n\n<p>Alle Auktionen<br /></p>\n\n\t</body>\n</html>

이것은 신체의 자식 요소로 작업 할 때 나에게 문제가된다.

이러한 불필요한 문자를 제거하는 가장 쉬운 방법은 무엇입니까?

HtmlAgilityPack은 개행과 탭에서 HTML을 정리하는 기능을 제공합니까?

인기 답변

이것은 문서 들여 쓰기이며 불필요한 공백 문자 및 개행 문자는 아닙니다.
나는 이것이 어떻게 문제가 될 수 있는지를 알지 못하지만 "\ t", "\ n"과 같은 특수 문자를 바꾸는 것은 불가능합니까?

빠른 검색을 수행하면이 HTML 민첩성 팩을 발견했습니다 . 코드를 깔끔하게 만듭니다.
어쩌면 일부 속성을 false로 설정하면 도움이 될 수 있습니다.




아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.
아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.