WPF C #, htmlAgilityPack의 웹 브라우저 콘텐츠 구문 분석

c# html-agility-pack webbrowser-control wpf

문제

웹 사이트에서 일부 데이터를 스크랩해야합니다. 사용자가 로그인하고 검색 도구를 사용하도록 허용하는 웹 브라우저를 만들고 결과를 검색하여 목록을 얻었 으면이 데이터를 가져 와서 추가 수행 할 수있는 기능을 갖기를 원합니다. 분석하고 오프라인으로 액세스 할 수 있습니다.

내가 가장 쉬운 접근법은 웹 브라우저를 사용하는 것인데, 상자에서 작동하고, 로그인 작업을하고, 서핑 작업을 수행하고, 내가 적절한 페이지에 도달하면 webBrowser.Document 마녀가 mshtml.HTMLDocumentClass (만약 m). 하지만 htmlAgilityPack은 HtmlDocument 요청합니다.

하나에서 다른 것으로 구문 분석하는 가장 쉬운 방법은 무엇입니까? webbroser는 WPF webbrowser입니다.

인기 답변

적절한 임시 파일을 파싱하지 않아도됩니다.

string html = (webBrowser.Document as HTMLDocument).documentElement.innerHTML;
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(html);

여기에서 .. 행복한 폐차 :)



아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.
아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.