HtmlAgilityPackレンダリングされたHTMLを取得する

awesomium html html-agility-pack html-generation

質問

私はHTMLAgilityPackを使用しており、ウェブサイトに表示されるような方法で文書を欲しいです。 html要素にvisibility:display:noneがある場合は、そのノードをドキュメントに入れないでください。

私は可視性を持つそのようなノードを除外する方法があります:noneまたはhidden ??

例えば

<div class="changeodlabel" style="display:none;"><span class="default">Should not be in document html</span></div>
<div class="changeodlabel" ><span class="default">Should be in document html</span></div>

人気のある回答

Html Agility Packには、CSSとJavascriptが何を意味しているかという概念はなく、HTMLを解析して何をするかを決めることができます。内容を取得する前にページを完全に評価したい場合は、より高度なHTMLパーサーが必要です。 Awesoniumが気になります。または、PhantomJSをラップすることもできます( ChutzPahのソースを参照してください )。




ライセンスを受けた: CC-BY-SA with attribution
所属していない Stack Overflow
このKBは合法ですか? はい、理由を学ぶ
ライセンスを受けた: CC-BY-SA with attribution
所属していない Stack Overflow
このKBは合法ですか? はい、理由を学ぶ