HtmlAgilityPack获取呈现的HTML

awesomium html html-agility-pack html-generation

我正在使用HTMLAgilityPack,我希望文档以它出现在网站上的方式。表示如果html元素具有可见性:display:none,我不希望在我的文档中使用该节点。

我有没有办法排除这样的节点有可见:无或隐藏?

例如

<div class="changeodlabel" style="display:none;"><span class="default">Should not be in document html</span></div>
<div class="changeodlabel" ><span class="default">Should be in document html</span></div>

热门答案

Html Agility Pack没有CSS和Javascript的含义,因此它只是解析HTML,让你决定如何处理它。如果您希望在抓取内容之前对页面进行全面评估,则需要更高级的HTML解析器。 想到了Awesonium 。或者您可以包装PhantomJS(查看ChutzPah源以了解如何完成 )。




许可下: CC-BY-SA with attribution
不隶属于 Stack Overflow
这个KB合法吗? 是的,了解原因
许可下: CC-BY-SA with attribution
不隶属于 Stack Overflow
这个KB合法吗? 是的,了解原因