Инструмент для автоматической записи XPATH для веб-парсера?

html-agility-pack html-parsing xpath

Вопрос

В настоящее время мне нужно извлечь данные с веб-сайтов. Я попытался использовать HTML Agility Pack, который использует XPATH для извлечения данных. Есть ли доступный инструмент, который автоматизирует запись XPATH, так что даже наивный пользователь может использовать настройку инструмента синтаксического анализа без записи XPATH. Пожалуйста, предоставьте свои ценные предложения для моих сценариев.

ПРИМЕЧАНИЕ. Некоторые инструменты доступны для записи XPATH, но для этого требуется хорошо сформированный XML, но в моем случае я искал HTML-документы в качестве входных данных.

Популярные ответы

Да, есть такой инструмент !

Конечно, вы можете использовать встроенный метод, присутствующий во многих браузерах (как предложил Майк). Однако есть дополнительные плагины и утилиты.

Я нашел, что Chrome Extension XPath Helper является самым полезным. Он служит той же цели, но он прост в использовании и создает более надежные выражения XPath (основанные на таких атрибутах, как id), а не только на позиции. Вы также можете редактировать выражение inline и видеть результаты в режиме реального времени.



Related

Лицензировано согласно: CC-BY-SA with attribution
Не связан с Stack Overflow
Лицензировано согласно: CC-BY-SA with attribution
Не связан с Stack Overflow