Получите ссылки с веб-страницы на текстовое поле (vb.net + html agility pack)

html-agility-pack screen-scraping vb.net

Вопрос

Я делаю приложение vb.net и im, используя htmlagilitypack. Мне нужно hap, чтобы получить ссылки на профиль из yellowpages.ca

Вот пример html:

<a href="/bus/Ontario/Brampton/A-Safe-Self-Storage/17142.html?what=af&amp;where=Ontario&amp;le=1238793c7aa%7Ccf8042ceaa%7C2ae32e5a2a" onmousedown="utag.link({link_name:'busname', link_attr1:'in_listing_left', listing_link:'18063_lpp|busname_af', headdir_link:'01252110|092202,00891210|092202,00184200|092202', position_address:'l_y', position_number:'l_6'});" id="mapLink5" title="See detailed information for A Safe Self Storage"><span class="listingTitle">A Safe Self Storage</span></a>

Это ссылка «/bus/Ontario/Brampton/A-Safe-Self-Storage/17142.html?what=af&where=Ontario&le=1238793c7aa%7Ccf8042ceaa%7C2ae32e5a2a».

Небольшая помощь будет оценена.

Принятый ответ

Вам необходимо изучить документацию.

Вот пример чтения HTML-файла, хранящегося на ПК.

HtmlDocument doc = new HtmlDocument();
 doc.Load("file.htm");
 foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href"])
 {
    HtmlAttribute att = link["href"];
    att.Value = FixLink(att);
 }
 doc.Save("file.htm");

Используйте конвертер для преобразования в VB.NET. Эта строка является ключом

Ссылка HtmlNode в doc.DocumentElement.SelectNodes ("// a [@href"])

Опять же, вам нужно прочитать документацию и понять, как разбирать HTML DOM.

Ниже приведен пример загрузки и разбора веб-страницы. Вам нужно будет использовать «HttpWebRequest» для потоковой передачи веб-страницы на веб-сервере.

Дополнительное чтение здесь



Related

Лицензировано согласно: CC-BY-SA with attribution
Не связан с Stack Overflow
Лицензировано согласно: CC-BY-SA with attribution
Не связан с Stack Overflow