Obtenga enlaces de la página web al cuadro de texto (vb.net + html agility pack)

html-agility-pack screen-scraping vb.net

Pregunta

Estoy haciendo una aplicación vb.net y estoy usando htmlagilitypack. Necesito hap para obtener los enlaces de perfil de yellowpages.ca

Aquí hay un ejemplo del html:

<a href="/bus/Ontario/Brampton/A-Safe-Self-Storage/17142.html?what=af&amp;where=Ontario&amp;le=1238793c7aa%7Ccf8042ceaa%7C2ae32e5a2a" onmousedown="utag.link({link_name:'busname', link_attr1:'in_listing_left', listing_link:'18063_lpp|busname_af', headdir_link:'01252110|092202,00891210|092202,00184200|092202', position_address:'l_y', position_number:'l_6'});" id="mapLink5" title="See detailed information for A Safe Self Storage"><span class="listingTitle">A Safe Self Storage</span></a>

Este es el enlace, "/bus/Ontario/Brampton/A-Safe-Self-Storage/17142.html?what=af&where=Ontario&le=1238793c7aa%7Ccf8042ceaa%7C2ae32e5a2a".

Un poco de ayuda sería apreciado.

Respuesta aceptada

Necesitas examinar la documentación.

Aquí hay una muestra de cómo leer un archivo HTML almacenado en la PC.

HtmlDocument doc = new HtmlDocument();
 doc.Load("file.htm");
 foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href"])
 {
    HtmlAttribute att = link["href"];
    att.Value = FixLink(att);
 }
 doc.Save("file.htm");

Utilice un convertidor para convertir a VB.NET. Esta linea es la clave.

Enlace de código HTML en doc.DocumentElement.SelectNodes ("// a [@href"])

Una vez más, debe leer la documentación y comprender cómo analizar el DOM HTML.

Aquí hay un ejemplo de carga y análisis de una página web. Tendrá que usar el "HttpWebRequest" para transmitir la página web desde un servidor web.

Lectura adicional aquí



Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow
¿Es esto KB legal? Sí, aprende por qué
Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow
¿Es esto KB legal? Sí, aprende por qué