웹 사이트에서 C # 데이터 긁기

c# html-agility-pack

문제

안녕하세요, 저는 C # 영역에서 꽤 새로운 것 같습니다. 올해 초부터 php와 JavaScript에있었습니다. 블로그의 게시물 및 댓글을 스크랩하고 싶습니다. 사이트는 http://www.somewhereinblog.net 입니다 .

내가 원하는 것은 1. 소프트웨어 2를 사용하여 로그인하고 싶습니다. 그런 다음 html을 다운로드합니다 3. 정규 표현식을 사용하여 xpath를 사용하여 게시물과 주석의 내용을 구분합니다.

나는 모든 곳을 수색했다. 거의 이해하지 못했다. 비록 내가 'htmlagilitypack'을 사용할 필요가 있다고 확신하지만. 내가 C #을 콘솔 또는 양식 응용 프로그램에 라이브러리를 추가하는 방법을 몰라. 누군가 나에게 도움을 줄 수 있습니까? 나는 이것을 아주 필요로한다. 그리고 나는 C #에 불과 한 주일뿐입니다. 자세한 정보가 있으면 감사하게 생각합니다. 열심히 기다리고있어.

사전 형제 들께 감사드립니다.

수락 된 답변

  1. Webclient 를 사용하여 로그인하고 다운로드 할 수 있습니다.
  2. 대신 html-agility-pack은 C # 코드의 문자열 안에 jQuery 구문을 사용할 수 있기 때문에 CsQuery를 좋아해서 html로 문자열을 다운로드하고 jQuery 및 HTML 페이지와 같이 검색하고 수행 할 수 있습니다.



아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.
아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.