Ich verwende HTML-Agility-Pack , um HTML- Tabelleninformationen zu analysieren. Jetzt gibt es einige HTML-Inhalt mit fehlenden End-Tags und von dieser Seite wegen der fehlenden End-Tags html agility pack nicht richtig Informationen analysieren.So möchte ich End-Tags einfügen, wo fehlende Tags sind, so html agility pack Informationen richtig zu analysieren. Also, um die fehlenden End-Tags einzufügen, was soll ich tun? Soll ich meinen eigenen Code dafür schreiben oder html ordip dazu benutzen?
Wenn html ordentlich pack dann was ist das beste html ordentlich pack , und wie man es wenn möglich irgendein Beispiel verwendet? Und wenn mein eigener Code so ist wie er sein kann?
Gibt es eine Option im HTML-Agility-Pack, die uns in die Lage versetzt, zuerst die HTML-Seite sauber zu machen und dann die Webseite zu parsen .
In Html Agility Pack konnte ich keine Option finden, die die HTML-Seite ordentlich macht. Es gibt eine Option, die die fehlenden schließenden Tags einfügt, aber es funktioniert nur in einer HTML-Seite. Diese Option im HTML-Agilitätspaket ist,
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.OptionFixNestedTags=true;
Ich habe auch Regex dafür versucht, aber es funktioniert auch nur für einige HTML-Seite.
So fand ich das beste html-Paket :
http://www.devx.com/dotnet/Article/20505/1763/page/2.
Wir können dort sehen: wie man die DLL importiert und wie man dieses saubere Paket benutzt, es gibt auch Beispielcode. Es ist großartig. Es kann die fehlenden schließenden Tags einfügen und macht Ihre HTML-Seite aufgeräumt.
Danke, dass du allen geholfen hast.