Welches ist das beste HTML-Paket? Gibt es eine Option im HTML-Agility-Pack, um HTML-Webseiten aufzuräumen?

c# html-agility-pack html-parsing htmltidy winforms

Frage

Ich verwende HTML-Agility-Pack , um HTML- Tabelleninformationen zu analysieren. Jetzt gibt es einige HTML-Inhalt mit fehlenden End-Tags und von dieser Seite wegen der fehlenden End-Tags html agility pack nicht richtig Informationen analysieren.So möchte ich End-Tags einfügen, wo fehlende Tags sind, so html agility pack Informationen richtig zu analysieren. Also, um die fehlenden End-Tags einzufügen, was soll ich tun? Soll ich meinen eigenen Code dafür schreiben oder html ordip dazu benutzen?

Wenn html ordentlich pack dann was ist das beste html ordentlich pack , und wie man es wenn möglich irgendein Beispiel verwendet? Und wenn mein eigener Code so ist wie er sein kann?

Gibt es eine Option im HTML-Agility-Pack, die uns in die Lage versetzt, zuerst die HTML-Seite sauber zu machen und dann die Webseite zu parsen .

Akzeptierte Antwort

In Html Agility Pack konnte ich keine Option finden, die die HTML-Seite ordentlich macht. Es gibt eine Option, die die fehlenden schließenden Tags einfügt, aber es funktioniert nur in einer HTML-Seite. Diese Option im HTML-Agilitätspaket ist,

  HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
      doc.OptionFixNestedTags=true;

Ich habe auch Regex dafür versucht, aber es funktioniert auch nur für einige HTML-Seite.

So fand ich das beste html-Paket :

http://www.devx.com/dotnet/Article/20505/1763/page/2.

Wir können dort sehen: wie man die DLL importiert und wie man dieses saubere Paket benutzt, es gibt auch Beispielcode. Es ist großartig. Es kann die fehlenden schließenden Tags einfügen und macht Ihre HTML-Seite aufgeräumt.

Danke, dass du allen geholfen hast.



Related

Lizenziert unter: CC-BY-SA with attribution
Nicht verbunden mit Stack Overflow
Lizenziert unter: CC-BY-SA with attribution
Nicht verbunden mit Stack Overflow