Outil pour écrire XPATH automatiquement pour l'analyseur Web?

html-agility-pack html-parsing xpath

Question

Actuellement, j'ai besoin d'extraire des données de sites Web. J'ai essayé d'utiliser HTML Agility Pack, qui utilise XPATH pour extraire des données. Existe-t-il un outil disponible qui automatise l'écriture de XPATH afin que même un utilisateur naïf puisse utiliser l'outil de configuration de l'analyse syntaxique sans écrire XPATH. S'il vous plaît fournir vos précieuses suggestions pour mes scénarios.

NOTE: Certains outils sont disponibles pour écrire XPATH mais cela nécessite un XML bien formé, mais dans mon cas, j'ai des documents HTML mal formés en entrée.

Réponse populaire

Oui, il existe un tel outil !

Vous pouvez certainement utiliser la méthode intégrée présente dans de nombreux navigateurs Web (comme suggéré par Mike). Cependant, il existe également des plugins et des utilitaires supplémentaires.

J'ai trouvé le Chrome Extension XPath Helper très utile. Il remplit le même objectif, mais il est facile à utiliser et crée des expressions XPath plus robustes (basées sur des attributs tels que id) plutôt que simplement la position. Vous pouvez également modifier l'expression en ligne et voir les résultats en temps réel.



Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow
Est-ce KB légal? Oui, apprenez pourquoi
Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow
Est-ce KB légal? Oui, apprenez pourquoi