Html Agility Pack: Nodo de comentario de búsqueda

c# html html-agility-pack web-scraping xpath

Pregunta

Estoy raspando un sitio web que usa Javascript para poblar dinámicamente el contenido de un sitio web con el paquete Html Agility.

Básicamente, estaba buscando el XPATH "\\div[@class='PricingInfo']" , pero ese nodo div se estaba escribiendo en el DOM a través de Javascript.

Por lo tanto, cuando cargue la página a través del paquete Html Agility, no se puede encontrar el XPATH mencionado anteriormente.

Resulta que hay un comentario antes de un bloque de script en particular que quiero analizar.

<!--Module 328 Buying Options Table-->
<script type="text/javascript" language="JavaScript">
    var data = {
        price: 30.00
    }
</script>

Para este sitio, hay muchos bloques de secuencias de comandos y, por lo tanto, tendría que limitarlo al encontrar este comentario generado automáticamente <!--Module 328 Buying Options Table--> y el hermano de ese nodo sería el bloque de secuencias de comandos correcto .

¿Alguna idea de cómo puedo buscar un comentario en particular y luego obtener el bloque de script adyacente?

¡Gracias!

Respuesta aceptada

htmlDoc.DocumentNode.SelectSingleNode("//comment()[contains(., 'Buying Options')]/following-sibling::script")


Related

Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow
Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow