htmlagilitypack을 사용하여 특정 태그 뒤에 오는 p 태그 가져 오기

c# html-agility-pack web-crawler

문제

htmlagilitypack C #을 사용하여 웹 사이트를 크롤링하고 있습니다.

i have in the source code of an html page

....
<p>this a p that come before h3</p>
....
....
<h3>this h3 </h3>

<p>first p after h3</p>

....

<p>seconde p after h3</p>

나는 모두 다가오는 모든 추신을 얻고 싶다.

위치를 사용하여 Ps를 필터링하는 데 사용할 위치가 있습니다.

여기서 (위치 (p)> 위치 (h3))

인기 답변

다음 코드를 시도해보십시오.

var htmlText = "source code of your html page";
var htmlDoc.LoadHtml(htmlText);
var h3= htmlDoc.DocumentNode.SelectNodes("//h2");
var lineNum = h3[0].Line;
var p = htmlDoc.DocumentNode.SelectNodes("//p").Where(x => x.Line > lineNum);


아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.
아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.