最高のHTML整頓パックはどれですか? HTMLの敏捷性パックにHTML Webページをきちんと整えるオプションがありますか?

c# html-agility-pack html-parsing htmltidy winforms

質問

私はHTMLの表形式の情報を解析するためにhtml agility packを使用しています 。終了タグが不足しているHTMLコンテンツがあります.HTMLアジリティパックは情報を正しく解析しません.HTMLアジリティパックが情報を適切に解析できるように、終了タグがないところに終了タグを挿入します。そのために欠けているエンディングタグを挿入するにはどうすればよいですか?自分自身のコードを書くか、 htmlの整頓したパックを使ってそれを行うべきですか?

html tidy packが最適なhtml整形パックであれば、それを可能な限りどのように使用するのですか?そして、自分のコードがそれが何であるかのようなものであれば?

htmlの敏捷性パックには、最初にhtmlページをきちんと整理してからウェブページを解析できるオプションがありますか

受け入れられた回答

HTMLアジリティパックでは、htmlページをtidyにするオプションが見つかりませんでした。欠落している終了タグを挿入するオプションが1つありますが、一部のhtmlページでのみ機能します.html agility packのオプションは、

  HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
      doc.OptionFixNestedTags=true;

私はそれのための正規表現を試みたが、それはまたいくつかのhtmlページのためだけに働く。

だから私は最高のHTML整頓パックが見つかりました:

http://www.devx.com/dotnet/Article/20505/1763/page/2。

私たちはそこに見ることができます:どのようにDLLをインポートすると、そのきちんとしたパックを使用するには、サンプルコードも利用可能です。それはすべてで素晴らしいです。 欠けている終了タグを挿入することができ、あなたのhtmlページをきれいにします。

誰も助けてくれてありがとう..



Related

ライセンスを受けた: CC-BY-SA with attribution
所属していない Stack Overflow
ライセンスを受けた: CC-BY-SA with attribution
所属していない Stack Overflow