получить теги p, которые появляются после определенного тега, используя htmlagilitypack

c# html-agility-pack web-crawler

Вопрос

Я просматриваю сайт с помощью htmlagilitypack c #:

i have in the source code of an html page

....
<p>this a p that come before h3</p>
....
....
<h3>this h3 </h3>

<p>first p after h3</p>

....

<p>seconde p after h3</p>

Я хочу, чтобы все получили все Ps, которые приходят после

есть ли способ использовать место для фильтрации позиции Ps.

где (позиция (p)> позиция (h3))

Популярные ответы

Попробуйте следующий код:

var htmlText = "source code of your html page";
var htmlDoc.LoadHtml(htmlText);
var h3= htmlDoc.DocumentNode.SelectNodes("//h2");
var lineNum = h3[0].Line;
var p = htmlDoc.DocumentNode.SelectNodes("//p").Where(x => x.Line > lineNum);


Лицензировано согласно: CC-BY-SA with attribution
Не связан с Stack Overflow
Является ли этот КБ законным? Да, узнайте, почему
Лицензировано согласно: CC-BY-SA with attribution
Не связан с Stack Overflow
Является ли этот КБ законным? Да, узнайте, почему