我在html敏捷包的帮助下解析html文件,从html文件中提取表数据。但是有一些html文件没有结束标签是可选的,或者没有起始标签也是可选的。所以html agility pack没有正确解析那个html页面。如果我在记事本++中打开那个html文件的内容然后使用选项TestFX-->TestFX HTML Tidy-->TiDy clean document
并使内容整洁如此。现在这个文件如果我使用html敏捷包进行解析,那么它会正确解析它。
用记事本++制作html页面整洁是最好的选择。
所以我不知道,但是用户不能这样做首先他/她用notepad ++整理页面然后继续。然后我该怎么办?
编辑我使用了html tidy pack但在某些情况下有一个整理的文件没有被解析但如果我在notepad ++中使这个页面整洁然后它被解析。
我认为Notepad ++正在使用HtmlTidy库,你也可以。主页在这里 。
或者也许您可以在线使用HrmlTidy等服务
编辑:你似乎想要使用notepad ++(在HtmlTidy之上)。 NP ++有一组有限的命令选项,因此加载文件不是问题。但我找不到任何接口的参考来完成你需要的其余部分:整理HTML并保存结果。