웹 페이지에서 텍스트 상자로 링크를 가져옵니다 (vb.net + html 민첩성 팩).

html-agility-pack screen-scraping vb.net

문제

나는 htmlagilitypack을 사용하여 vb.net 앱과 메신저를 만들고 있습니다. 나는 yellowpages.ca에서 프로필 링크를 얻으려고 할 필요가있다.

다음은 html의 예입니다.

<a href="/bus/Ontario/Brampton/A-Safe-Self-Storage/17142.html?what=af&amp;where=Ontario&amp;le=1238793c7aa%7Ccf8042ceaa%7C2ae32e5a2a" onmousedown="utag.link({link_name:'busname', link_attr1:'in_listing_left', listing_link:'18063_lpp|busname_af', headdir_link:'01252110|092202,00891210|092202,00184200|092202', position_address:'l_y', position_number:'l_6'});" id="mapLink5" title="See detailed information for A Safe Self Storage"><span class="listingTitle">A Safe Self Storage</span></a>

이것은 "/bus/Ontario/Brampton/A-Safe-Self-Storage/17142.html?what=af&where=Ontario&le=1238793c7aa%7Ccf8042ceaa%7C2ae32e5a2a"링크입니다.

약간의 도움을 주시면 감사하겠습니다.

수락 된 답변

문서를 검토해야합니다.

다음은 PC에 저장된 HTML 파일을 읽는 예제입니다.

HtmlDocument doc = new HtmlDocument();
 doc.Load("file.htm");
 foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href"])
 {
    HtmlAttribute att = link["href"];
    att.Value = FixLink(att);
 }
 doc.Save("file.htm");

변환기를 사용하여 VB.NET으로 변환하십시오. 이 줄이 열쇠 야.

doc.DocumentElement.SelectNodes ( "// a [@href"])의 HtmlNode 링크

다시 말하지만, 문서를 읽고 HTML DOM을 구문 분석하는 방법을 이해해야합니다.

다음 은 웹 페이지를로드하고 파싱하는 예제입니다. 웹 서버 형태의 웹 서버를 스트리밍하려면 "HttpWebRequest"를 사용해야합니다.

여기에 추가 독서



아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.
아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.