Ottieni collegamenti dalla pagina web alla casella di testo (pacchetto agility vb.net + html)

html-agility-pack screen-scraping vb.net

Domanda

Sto facendo un'app di vb.net e sto usando htmlagilitypack. Ho bisogno di avere i link del profilo da yellowpages.ca

Ecco un esempio di html:

<a href="/bus/Ontario/Brampton/A-Safe-Self-Storage/17142.html?what=af&amp;where=Ontario&amp;le=1238793c7aa%7Ccf8042ceaa%7C2ae32e5a2a" onmousedown="utag.link({link_name:'busname', link_attr1:'in_listing_left', listing_link:'18063_lpp|busname_af', headdir_link:'01252110|092202,00891210|092202,00184200|092202', position_address:'l_y', position_number:'l_6'});" id="mapLink5" title="See detailed information for A Safe Self Storage"><span class="listingTitle">A Safe Self Storage</span></a>

Questo è il link "/bus/Ontario/Brampton/A-Safe-Self-Storage/17142.html?what=af&where=Ontario&le=1238793c7aa%7Ccf8042ceaa%7C2ae32e5a2a".

Un piccolo aiuto sarebbe apprezzato.

Risposta accettata

È necessario esaminare la documentazione.

Ecco un esempio di lettura di un file HTML memorizzato sul PC

HtmlDocument doc = new HtmlDocument();
 doc.Load("file.htm");
 foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href"])
 {
    HtmlAttribute att = link["href"];
    att.Value = FixLink(att);
 }
 doc.Save("file.htm");

Utilizzare un convertitore per convertire in VB.NET. Questa linea è la chiave

Collegamento HtmlNode in doc.DocumentElement.SelectNodes ("// a [@href"])

Ancora una volta, è necessario leggere la documentazione e capire come analizzare il DOM HTML.

Ecco un esempio di caricamento e analisi di una pagina Web. Dovrai utilizzare "HttpWebRequest" per eseguire lo streaming della pagina web da un server web.

Letture aggiuntive qui



Related

Autorizzato sotto: CC-BY-SA with attribution
Non affiliato con Stack Overflow
È legale questo KB? Sì, impara il perché
Autorizzato sotto: CC-BY-SA with attribution
Non affiliato con Stack Overflow
È legale questo KB? Sì, impara il perché