obtener etiquetas p que vienen después de una etiqueta específica usando htmlagilitypack

c# html-agility-pack web-crawler

Pregunta

Estoy rastreando un sitio web usando htmlagilitypack c #:

i have in the source code of an html page

....
<p>this a p that come before h3</p>
....
....
<h3>this h3 </h3>

<p>first p after h3</p>

....

<p>seconde p after h3</p>

Quiero a todos obtener todos los Ps que vienen después

¿hay una manera de usar un donde filtrar Ps usando la posición.

donde (posición (p)> posición (h3))

Respuesta popular

Prueba el siguiente código:

var htmlText = "source code of your html page";
var htmlDoc.LoadHtml(htmlText);
var h3= htmlDoc.DocumentNode.SelectNodes("//h2");
var lineNum = h3[0].Line;
var p = htmlDoc.DocumentNode.SelectNodes("//p").Where(x => x.Line > lineNum);


Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow
¿Es esto KB legal? Sí, aprende por qué
Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow
¿Es esto KB legal? Sí, aprende por qué