javascript에서 렌더링 된 html로 웹 페이지 소스를 얻으십시오.

asp.net c# html-agility-pack vb.net

문제

이걸 사용하면

WebClient client = new WebClient();
String htmlCode = client.DownloadString("http://test.net");

나는 민첩성 팩을 사용하여 html을 스캔하고 필요한 대부분의 태그를 얻을 수 있지만 javascript에 의해 렌더링되는 html이 누락되었습니다.

내 질문은 C #을 사용하여 최종 렌더링 된 페이지 소스를 얻는 방법입니다. 거기에 자바 스크립트를 실행 한 후 최종 렌더링 된 소스를 얻으려면 WebClient에 뭔가가 있습니까?

인기 답변

HTML 민첩성 팩만으로는 원하는 것을 수행 할 수 없으며 자바 스크립트 엔진도 필요합니다. 그렇게하기 위해 Geckofx와 같은 것을 체크 아웃 할 수 있습니다. Geckofx는 완전히 기능하는 웹 브라우저를 응용 프로그램에 포함시키고 페이지가 렌더링 된 후 dom의 내용에 프로그래밍 방식으로 액세스 할 수 있도록 허용합니다.

http://code.google.com/p/geckofx/



아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.
아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.