哪個是最好的HTML整潔包? HTML agility pack中是否有任何選項可以使HTML網頁整潔?

c# html-agility-pack html-parsing htmltidy winforms

我正在使用html agility pack來解析html 表格信息 。現在有一些html內容缺少結束標記,並且由於缺少結束標記而來自此頁面html敏捷包不能正確解析信息。所以我想在缺少結束標記的地方插入結束標記,以便html敏捷包正確解析信息。所以要插入缺少的結束標記我該怎麼辦?我應該為此編寫自己的代碼還是使用html tidy pack來做到這一點?

如果html整潔包然後哪個是最好的html整潔包 ,如果可能的話如何使用它的任何例子?如果我自己的代碼比它可能是什麼樣的?

在html agility pack中是否有任何選項可以使我們能夠首先使html頁面整潔 ,然後解析網頁。

一般承認的答案

在Html Agility Pack中,我找不到任何使html頁面整潔的選項。有一個選項可以插入缺少的結束標記,但它只適用於某些html頁面。在html敏捷包中的選項是,

  HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
      doc.OptionFixNestedTags=true;

我也嘗試過regex,但它也適用於某些html頁面。

所以我發現最好的html整潔包是:

http://www.devx.com/dotnet/Article/20505/1763/page/2。

我們可以看到:如何導入dll以及如何使用整齊的包,還有示例代碼可用。它很棒。它可以插入缺少的結束標記並使您的html頁面整潔。

謝謝你幫助大家..




許可下: CC-BY-SA with attribution
不隸屬於 Stack Overflow
這個KB合法嗎? 是的,了解原因
許可下: CC-BY-SA with attribution
不隸屬於 Stack Overflow
這個KB合法嗎? 是的,了解原因