Kann ich notepad ++ exe in meiner Anwendung verwenden?

c# html-agility-pack htmltidy notepad++ winforms

Frage

Ich analysiere HTML-Datei mit Hilfe des HTML Agility Pack, um die Tabellendaten aus der HTML-Datei zu extrahieren. Aber es gibt einige HTML-Dateien, wo gibt es keine Ende-Tags, die optional ist oder es gibt keine Start-Tag, die auch optional ist.So HTML Agility Pack nicht diese HTML-Seite richtig zu analysieren.Wenn ich den Inhalt dieser HTML-Datei im Editor öffnen ++ dann mit der Option TestFX-->TestFX HTML Tidy-->TiDy clean document und mache den Inhalt TestFX-->TestFX HTML Tidy-->TiDy clean document . Und jetzt diese Datei Wenn ich mit dem HTML-Agility-Pack analysiere, dann analysiere ich es richtig.

HTML-Seite mit Notizblock ++ aufgeräumt ist die beste Option.

Also ich weiß es nicht, aber der Benutzer kann das nicht machen, wie er zuerst die Seite mit Notizblock ++ säubert und dann weitergeht. Was soll ich dann tun?

BEARBEITEN Ich habe HTML-Tidy-Pack verwendet, aber in einigen Fällen gibt es eine Datei, die aufgeräumt ist, die nicht geparst ist, aber wenn ich diese Seite in Notepad ++ aufgeräumt habe, dann wird es geparst.

Akzeptierte Antwort

Ich denke, dass Notepad ++ die HtmlTidy-Bibliothek verwendet, und Sie auch. Die Hauptseite ist hier .

Oder vielleicht können Sie einen Dienst wie HrmlTidy online verwenden

Edit: Sie scheinen Notepad ++ (über HtmlTidy) zu verwenden. NP ++ verfügt über eine begrenzte Anzahl von Befehlsoptionen, daher ist das Laden der Datei nicht das Problem. Aber ich konnte keinen Verweis auf eine Schnittstelle finden, um den Rest von dem zu tun, was Sie brauchen: Ordnen Sie den HTML-Code und speichern Sie die Ergebnisse.


Beliebte Antwort

HTML Tidy ist unabhängig von Notepad ++ und Sie können diese Open-Source-Komponente direkt in Ihrem .NET-Projekt (oder einer anderen Sprache) verwenden.

Weitere Details zur Verwendung dieses in .Net speziell finden Sie hier




Lizenziert unter: CC-BY-SA with attribution
Nicht verbunden mit Stack Overflow
Ist diese KB legal? Ja, lerne warum
Lizenziert unter: CC-BY-SA with attribution
Nicht verbunden mit Stack Overflow
Ist diese KB legal? Ja, lerne warum