使用HtmlAgilityPack解析時刪除空格和換行符

asp.net c# html-agility-pack trim

我嘗試使用HtmlAgilityPack以下列方式解析HTML:

HtmlDocument htmlDoc = new HtmlDocument();
htmlDoc.LoadHtml(xhtmlString);

不幸的是,xhtmlString包含不必要的空格和換行符,因此htmlDoc的_text現在看起來像這樣:

<html xmlns=\"http://www.w3.org/1999/xhtml\">\n\t<head></head>\n\t<body>\n\n<p>Alle Auktionen<br /></p>\n\n\t</body>\n</html>

在使用身體的子元素時,這對我來說是一個問題。

刪除這些不必要字符的最簡單方法是什麼?

HtmlAgilityPack是否提供某種功能來清除新行和標籤中的HTML?

熱門答案

這是文檔縮進,而不是不必要的空格和換行符。
我不知道這可能是一個問題,但你不能只更換特殊的字符,如“\ t”,“\ n”?

快速搜索我發現這個Html Agility Pack:使代碼看起來整潔
也許將某些屬性設置為false可能會有所幫助




許可下: CC-BY-SA with attribution
不隸屬於 Stack Overflow
這個KB合法嗎? 是的,了解原因
許可下: CC-BY-SA with attribution
不隸屬於 Stack Overflow
這個KB合法嗎? 是的,了解原因