獲取從網頁到文本框的鏈接(vb.net + html敏捷包)

html-agility-pack screen-scraping vb.net

我正在使用htmlagilitypack製作一個vb.net應用程序。我需要從yellowpages.ca獲取個人資料鏈接

這是html的一個例子:

<a href="/bus/Ontario/Brampton/A-Safe-Self-Storage/17142.html?what=af&amp;where=Ontario&amp;le=1238793c7aa%7Ccf8042ceaa%7C2ae32e5a2a" onmousedown="utag.link({link_name:'busname', link_attr1:'in_listing_left', listing_link:'18063_lpp|busname_af', headdir_link:'01252110|092202,00891210|092202,00184200|092202', position_address:'l_y', position_number:'l_6'});" id="mapLink5" title="See detailed information for A Safe Self Storage"><span class="listingTitle">A Safe Self Storage</span></a>

這是鏈接“/bus/Ontario/Brampton/A-Safe-Self-Storage/17142.html?what=af&where=Ontario&le=1238793c7aa%7Ccf8042ceaa%7C2ae32e5a2a”。

一點幫助將不勝感激。

一般承認的答案

您需要檢查文檔。

以下是讀取存儲在PC上的HTML文件的示例

HtmlDocument doc = new HtmlDocument();
 doc.Load("file.htm");
 foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href"])
 {
    HtmlAttribute att = link["href"];
    att.Value = FixLink(att);
 }
 doc.Save("file.htm");

使用轉換器轉換為VB.NET。這條線是關鍵

doc.DocumentElement.SelectNodes中的HtmlNode鏈接(“// a [@href”])

同樣,您需要閱讀文檔並了解如何解析HTML DOM。

以下是加載和解析網頁的示例。您需要使用“HttpWebRequest”將網頁流式傳輸到網絡服務器。

另外閱讀這裡




許可下: CC-BY-SA with attribution
不隸屬於 Stack Overflow
這個KB合法嗎? 是的,了解原因
許可下: CC-BY-SA with attribution
不隸屬於 Stack Overflow
這個KB合法嗎? 是的,了解原因