Tool zum automatischen Schreiben von XPATH für Webparser?

html-agility-pack html-parsing xpath

Frage

Derzeit muss ich Daten von Websites extrahieren. Ich habe versucht, HTML Agility Pack zu verwenden, das XPATH verwendet, um Daten zu extrahieren. Gibt es ein Tool, das das Schreiben von XPATH automatisiert, so dass auch ein naive Benutzer das Parsing-Tool konfigurieren kann, ohne XPATH zu schreiben. Bitte geben Sie Ihre wertvollen Vorschläge für meine Szenarien an.

HINWEIS: Einige Tools stehen zum Schreiben von XPATH zur Verfügung, aber es erfordert wohlgeformtes XML, aber in meinem Fall habe ich fehlerhafte HTML-Dokumente als Eingabe.

Beliebte Antwort

Ja, da ist ein solches Werkzeug !

Sie können sicherlich die eingebaute Methode verwenden, die in vielen Webbrowsern vorhanden ist (wie von Mike vorgeschlagen). Es gibt jedoch auch zusätzliche Plugins und Dienstprogramme.

Ich habe den Chrome-Erweiterung- XPath-Helfer als den nützlichsten gefunden. Es dient demselben Zweck, ist aber einfach zu verwenden und erstellt robustere XPath-Ausdrücke (basierend auf Attributen wie id) und nicht nur die Position. Sie können den Ausdruck auch inline bearbeiten und die Ergebnisse in Echtzeit anzeigen.



Related

Lizenziert unter: CC-BY-SA with attribution
Nicht verbunden mit Stack Overflow
Lizenziert unter: CC-BY-SA with attribution
Nicht verbunden mit Stack Overflow