HtmlAgilityPack Ruft gerendertes HTML ab

awesomium html html-agility-pack html-generation

Frage

Ich benutze HTMLAgilityPack und ich möchte Dokument so, wie es auf der Website erscheint. Bedeutet, wenn ein HTML-Element Sichtbarkeit hat: display: none, ich möchte diesen Knoten nicht in meinem Dokument haben.

Ich habe da irgendeinen Weg solche Knoten auszuschließen: keine sichtbar oder versteckt ??

z.B

<div class="changeodlabel" style="display:none;"><span class="default">Should not be in document html</span></div>
<div class="changeodlabel" ><span class="default">Should be in document html</span></div>

Beliebte Antwort

Html Agility Pack hat keine Ahnung, was CSS und Javascript bedeuten. Es analysiert nur den HTML-Code und lässt Sie entscheiden, was Sie damit machen wollen. Wenn Sie möchten, dass die Seite vollständig ausgewertet wird, bevor Sie den Inhalt erfassen, benötigen Sie einen erweiterten HTML-Parser. Awesonium kommt mir in den Sinn. Oder Sie können PhantomJS einpacken (sehen Sie sich die ChutzPah-Quellen an, um zu sehen, wie das geht ).




Lizenziert unter: CC-BY-SA with attribution
Nicht verbunden mit Stack Overflow
Ist diese KB legal? Ja, lerne warum
Lizenziert unter: CC-BY-SA with attribution
Nicht verbunden mit Stack Overflow
Ist diese KB legal? Ja, lerne warum