Html Agility Pack. Загрузите и очистите веб-страницу

c# html-agility-pack web-scraping

Вопрос

Это лучший способ получить веб-страницу при очистке?

HttpWebRequest oReq = (HttpWebRequest)WebRequest.Create(url);
HttpWebResponse resp = (HttpWebResponse)oReq.GetResponse();

var doc = new HtmlAgilityPack.HtmlDocument();

doc.Load(resp.GetResponseStream());
var element = doc.GetElementbyId("//start-left");
var element2 = doc.DocumentNode.SelectSingleNode("//body");
string html = doc.DocumentNode.OuterHtml;

Я видел HtmlWeb().Load чтобы получить веб-страницу. Является ли это лучшей альтернативой загрузке и очистке веб-страницы?


Хорошо, я попробую это вместо этого.

HtmlDocument doc = web.Load(url);

Теперь, когда я получил свой doc и не получил таких свойств mutch. Никому не нравится SelectSingleNode . Единственный, который я могу использовать, это GetElementById , и это работает, но я хочу получить класс.

Нужно ли мне это делать так?

var htmlBody = doc.DocumentNode.SelectSingleNode("//body");
htmlBody.SelectSingleNode("//paging");

Популярные ответы

Гораздо проще использовать HtmlWeb.

string Url = "http://something";
HtmlWeb web = new HtmlWeb();
HtmlDocument doc = web.Load(Url);



Лицензировано согласно: CC-BY-SA with attribution
Не связан с Stack Overflow
Является ли этот КБ законным? Да, узнайте, почему
Лицензировано согласно: CC-BY-SA with attribution
Не связан с Stack Overflow
Является ли этот КБ законным? Да, узнайте, почему