obtener etiquetas p que vienen después de una etiqueta específica usando htmlagilitypack

c# html-agility-pack web-crawler

Pregunta

Estoy rastreando un sitio web usando htmlagilitypack c #:

i have in the source code of an html page

....
<p>this a p that come before h3</p>
....
....
<h3>this h3 </h3>

<p>first p after h3</p>

....

<p>seconde p after h3</p>

Quiero a todos obtener todos los Ps que vienen después

¿hay una manera de usar un donde filtrar Ps usando la posición.

donde (posición (p)> posición (h3))

Respuesta popular

Prueba el siguiente código:

var htmlText = "source code of your html page";
var htmlDoc.LoadHtml(htmlText);
var h3= htmlDoc.DocumentNode.SelectNodes("//h2");
var lineNum = h3[0].Line;
var p = htmlDoc.DocumentNode.SelectNodes("//p").Where(x => x.Line > lineNum);


Related

Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow
Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow