Html 민첩성 팩 : 주석 노드 찾기

c# html html-agility-pack web-scraping xpath

문제

자바 스크립트를 사용하여 웹 사이트 콘텐츠를 동적으로 채우는 웹 사이트를 스크랩하고 있습니다.

기본적으로 XPath "\\div[@class='PricingInfo']" 를 검색했지만 div 노드가 Javascript를 통해 DOM에 쓰여지고있었습니다.

그래서, 내가 Html 민첩성 팩을 통해 페이지를로드 할 때 위에서 언급 한 XPATH를 찾을 수 없습니다.

구문 분석하려는 특정 스크립트 블록 앞에 주석이 있습니다.

<!--Module 328 Buying Options Table-->
<script type="text/javascript" language="JavaScript">
    var data = {
        price: 30.00
    }
</script>

이 사이트에는 많은 스크립트 블록이 있으므로이 자동 생성 된 주석 <!--Module 328 Buying Options Table--> 및 해당 노드의 형제가 올바른 스크립트 블록이 될 수 있도록 범위를 좁혀 야합니다 <!--Module 328 Buying Options Table--> .

특정 코멘트를 검색 한 다음 인접한 스크립트 블록을 얻는 방법에 대한 아이디어는 있습니까?

고맙습니다!

수락 된 답변

htmlDoc.DocumentNode.SelectSingleNode("//comment()[contains(., 'Buying Options')]/following-sibling::script")



아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.
아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.