Erhalte Links von der Webseite zur Textbox (vb.net + html agility pack)

html-agility-pack screen-scraping vb.net

Frage

Ich mache eine vb.net App und benutze htmlagilitypack. Ich benötige die Profil-Links von yellowpages.ca

Hier ist ein Beispiel für den HTML-Code:

<a href="/bus/Ontario/Brampton/A-Safe-Self-Storage/17142.html?what=af&amp;where=Ontario&amp;le=1238793c7aa%7Ccf8042ceaa%7C2ae32e5a2a" onmousedown="utag.link({link_name:'busname', link_attr1:'in_listing_left', listing_link:'18063_lpp|busname_af', headdir_link:'01252110|092202,00891210|092202,00184200|092202', position_address:'l_y', position_number:'l_6'});" id="mapLink5" title="See detailed information for A Safe Self Storage"><span class="listingTitle">A Safe Self Storage</span></a>

Dies ist der Link "/bus/Ontario/Brampton/A-Safe-Self-Storage/17142.html?what=af&where=Ontario&le=1238793c7aa%7Ccf8042ceaa%7C2ae32e5a2a".

Ein bisschen Hilfe wäre willkommen.

Akzeptierte Antwort

Sie müssen die Dokumentation prüfen.

Hier sehen Sie ein Beispiel zum Lesen einer HTML-Datei, die auf dem PC gespeichert ist

HtmlDocument doc = new HtmlDocument();
 doc.Load("file.htm");
 foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href"])
 {
    HtmlAttribute att = link["href"];
    att.Value = FixLink(att);
 }
 doc.Save("file.htm");

Verwenden Sie einen Konverter, um in VB.NET zu konvertieren. Diese Linie ist der Schlüssel

HtmlNode-Verknüpfung in doc.DocumentElement.SelectNodes ("// a [@href"])

Auch hier müssen Sie die Dokumentation lesen und verstehen, wie Sie das HTML-DOM parsen können.

Hier finden Sie ein Beispiel zum Laden und Parsen einer Webseite. Sie müssen die "HttpWebRequest" verwenden, um die Webseite von einem Webserver zu streamen.

Zusätzliche Informationen hier



Lizenziert unter: CC-BY-SA with attribution
Nicht verbunden mit Stack Overflow
Ist diese KB legal? Ja, lerne warum
Lizenziert unter: CC-BY-SA with attribution
Nicht verbunden mit Stack Overflow
Ist diese KB legal? Ja, lerne warum