J'utilise HTMLAgilityPack et je veux un document tel qu'il apparaît sur le site Web. Cela signifie si un élément html a une visibilité: display: none, je ne veux pas de ce noeud dans mon document.
J'ai-t-il un moyen d'exclure de tels nœuds ayant visible: aucun ou caché ??
par exemple
<div class="changeodlabel" style="display:none;"><span class="default">Should not be in document html</span></div>
<div class="changeodlabel" ><span class="default">Should be in document html</span></div>
Html Agility Pack n'a aucune idée de ce que CSS et Javascript signifient, il analyse donc le code HTML et vous permet de décider quoi en faire. Si vous souhaitez que la page soit entièrement évaluée avant de récupérer le contenu, vous aurez besoin d'un analyseur HTML plus avancé. Awesonium vient à l'esprit. Ou vous pouvez envelopper PhantomJS (consultez les sources de ChutzPah pour voir comment cela peut être fait ).