哪个是最好的HTML整洁包? HTML agility pack中是否有任何选项可以使HTML网页整洁?

c# html-agility-pack html-parsing htmltidy winforms

我正在使用html agility pack来解析html 表格信息 。现在有一些html内容缺少结束标记,并且由于缺少结束标记而来自此页面html敏捷包不能正确解析信息。所以我想在缺少结束标记的地方插入结束标记,以便html敏捷包正确解析信息。所以要插入缺少的结束标记我该怎么办?我应该为此编写自己的代码还是使用html tidy pack来做到这一点?

如果html整洁包然后哪个是最好的html整洁包 ,如果可能的话如何使用它的任何例子?如果我自己的代码比它可能是什么样的?

在html agility pack中是否有任何选项可以使我们能够首先使html页面整洁 ,然后解析网页。

一般承认的答案

在Html Agility Pack中,我找不到任何使html页面整洁的选项。有一个选项可以插入缺少的结束标记,但它只适用于某些html页面。在html敏捷包中的选项是,

  HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
      doc.OptionFixNestedTags=true;

我也尝试过regex,但它也适用于某些html页面。

所以我发现最好的html整洁包是:

http://www.devx.com/dotnet/Article/20505/1763/page/2。

我们可以看到:如何导入dll以及如何使用整齐的包,还有示例代码可用。它很棒。它可以插入缺少的结束标记并使您的html页面整洁。

谢谢你帮助大家..



Related

许可下: CC-BY-SA with attribution
不隶属于 Stack Overflow
许可下: CC-BY-SA with attribution
不隶属于 Stack Overflow