asyncronous 자바 스크립트가 완료된 후 웹 페이지를로드하고 HTML을 파싱합니다.

c# html html-agility-pack html-parsing javascript

문제

개인 사용하십시오 .net 프로젝트를로드하고 skyscanner.net 검색 결과 페이지를 구문 분석하려고합니다. Skyscanner에는 이러한 종류의 작업에 대한 API가 있지만 사용 가능한 무료 개인 라이센스가없는 것 같습니다.

문제는 Skyscanner가 검색 프로세스를 완료하는 데 많은 시간을 필요로하므로 HtmlAgilityPack을 사용하여 찾고있는 콘텐츠가없는 페이지에서 문서 결과를로드하는 것입니다.

WebBrowser 객체와 해당 이벤트 DocumentCompleted를 사용하려고 시도했지만 실제 검색 결과가 페이지에로드되기 전에 이벤트가 트리거 된 것처럼 보입니다.

그래서, 페이지를로드 할 수있는 방법이 있습니까? 자바 스크립트 비동기식 스크립트가 페이지를 완전히 채우고 HTML을 구문 분석 할 때까지 기다리는 것입니까?

인기 답변

PhantomJs를 사용할 수 있습니다. 나는이 문제를 가지고 있지만 내 문제에 대한 해결책을 찾지 못했습니다. 나는 이 기사 에서 PhantomJs를 사용하고 10 초 후에로드 된 페이지를 얻는다. 내 의견으로는, 당신의 문제점을위한 제일 해결책은 저 기사이다.



아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.
아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.