Ich benutze HTMLAgilityPack und ich möchte Dokument so, wie es auf der Website erscheint. Bedeutet, wenn ein HTML-Element Sichtbarkeit hat: display: none, ich möchte diesen Knoten nicht in meinem Dokument haben.
Ich habe da irgendeinen Weg solche Knoten auszuschließen: keine sichtbar oder versteckt ??
z.B
<div class="changeodlabel" style="display:none;"><span class="default">Should not be in document html</span></div>
<div class="changeodlabel" ><span class="default">Should be in document html</span></div>
Html Agility Pack hat keine Ahnung, was CSS und Javascript bedeuten. Es analysiert nur den HTML-Code und lässt Sie entscheiden, was Sie damit machen wollen. Wenn Sie möchten, dass die Seite vollständig ausgewertet wird, bevor Sie den Inhalt erfassen, benötigen Sie einen erweiterten HTML-Parser. Awesonium kommt mir in den Sinn. Oder Sie können PhantomJS einpacken (sehen Sie sich die ChutzPah-Quellen an, um zu sehen, wie das geht ).