使用htmlagilitypack獲取特定標記之後的p標記

c# html-agility-pack web-crawler

我正在使用htmlagilitypack c#抓取一個網站:

i have in the source code of an html page

....
<p>this a p that come before h3</p>
....
....
<h3>this h3 </h3>

<p>first p after h3</p>

....

<p>seconde p after h3</p>

我希望所有人都能得到所有後來的P ..

有沒有辦法使用位置過濾Ps的位置。

其中(位置(p)>位置(h3))

熱門答案

請嘗試以下代碼:

var htmlText = "source code of your html page";
var htmlDoc.LoadHtml(htmlText);
var h3= htmlDoc.DocumentNode.SelectNodes("//h2");
var lineNum = h3[0].Line;
var p = htmlDoc.DocumentNode.SelectNodes("//p").Where(x => x.Line > lineNum);


Related

許可下: CC-BY-SA with attribution
不隸屬於 Stack Overflow
許可下: CC-BY-SA with attribution
不隸屬於 Stack Overflow