Как использовать ScrapySharp для анализа элементов в html-документе?

c# html html-agility-pack scrapysharp web-scraping

Вопрос

Вот официальный представитель проекта: «Документация»:

https://bitbucket.org/rflechner/scrapysharp/wiki/Home


Независимо от того, что я пытаюсь, я не могу найти метод CssSelect() который библиотека должна добавить, чтобы упростить запрос. Вот что я пробовал:

using ScrapySharp.Core;
using ScrapySharp.Html.Parsing;
using HtmlAgilityPack;

HtmlWeb web = new HtmlWeb();
HtmlDocument doc = web.Load("http://www.stackoverflow.com");

var page = doc.DocumentNode.SelectSingleNode("//body");
page.CssSel???

Как я могу использовать эту библиотеку? В документации неясно, какой тип html .

Принятый ответ

Добавить

using ScrapySharp.Extensions;

Похоже, тебе это не хватает. Это должно сделать CssSelect доступным.

На всякий случай пример помогает, вот и метод, который я использую в проекте:

private string GetPdfUrl(HtmlDocument document, string baseUrl)
{
    return new Uri(new Uri(baseUrl), document.DocumentNode.CssSelect(".table-of-content .head-row td.download a.text-pdf").Single().Attributes["href"].Value).ToString();
}


Related

Лицензировано согласно: CC-BY-SA with attribution
Не связан с Stack Overflow
Лицензировано согласно: CC-BY-SA with attribution
Не связан с Stack Overflow