目前我需要从网站中提取数据。我尝试使用HTML Agility Pack,它使用XPATH提取数据。是否有可用的工具可以自动编写XPATH,这样即使是天真的用户也可以使用配置解析工具而无需编写XPATH。请为我的方案提供宝贵的建议。
注意:有些工具可用于编写XPATH,但它需要格式良好的XML,但在我的情况下,我输入格式错误的HTML文档。
是的,有这样的工具 !
您当然可以使用许多Web浏览器中存在的内置方法(如Mike所建议的)。但是,还有其他插件和实用程序。
我发现Chrome Extension XPath Helper是最有用的。它具有相同的用途,但它易于使用并创建更强大的XPath表达式(基于id等属性)而不仅仅是位置。您还可以内联编辑表达式并实时查看结果。