Erhalte p Tags, die nach einem bestimmten Tag mit htmlagilitypack kommen

c# html-agility-pack web-crawler

Frage

Ich crawle eine Website mit htmlagilitypack c #:

i have in the source code of an html page

....
<p>this a p that come before h3</p>
....
....
<h3>this h3 </h3>

<p>first p after h3</p>

....

<p>seconde p after h3</p>

Ich möchte alle Ps bekommen, die danach kommen

Gibt es eine Möglichkeit, eine Wo zu verwenden, um Ps mit der Position zu filtern.

wo (Position (p)> Position (h3))

Beliebte Antwort

Probieren Sie den folgenden Code aus:

var htmlText = "source code of your html page";
var htmlDoc.LoadHtml(htmlText);
var h3= htmlDoc.DocumentNode.SelectNodes("//h2");
var lineNum = h3[0].Line;
var p = htmlDoc.DocumentNode.SelectNodes("//p").Where(x => x.Line > lineNum);


Lizenziert unter: CC-BY-SA with attribution
Nicht verbunden mit Stack Overflow
Ist diese KB legal? Ja, lerne warum
Lizenziert unter: CC-BY-SA with attribution
Nicht verbunden mit Stack Overflow
Ist diese KB legal? Ja, lerne warum