¿Cómo usar ScrapySharp para analizar elementos en un documento html?

c# html html-agility-pack scrapysharp web-scraping

Pregunta

Aquí está el proyecto oficial "Documentación":

https://bitbucket.org/rflechner/scrapysharp/wiki/Home


No importa lo que intente, no puedo encontrar el método CssSelect() que la biblioteca debe agregar para facilitar las consultas. Esto es lo que he intentado:

using ScrapySharp.Core;
using ScrapySharp.Html.Parsing;
using HtmlAgilityPack;

HtmlWeb web = new HtmlWeb();
HtmlDocument doc = web.Load("http://www.stackoverflow.com");

var page = doc.DocumentNode.SelectSingleNode("//body");
page.CssSel???

¿Exactamente cómo uso esta biblioteca? En la documentación no está claro qué tipo de html es.

Respuesta aceptada

Añadir

using ScrapySharp.Extensions;

Parece que te estás perdiendo eso. Eso debería hacer que CssSelect esté disponible.

En caso de que un ejemplo sirva de ayuda, aquí también hay un método que uso en un proyecto:

private string GetPdfUrl(HtmlDocument document, string baseUrl)
{
    return new Uri(new Uri(baseUrl), document.DocumentNode.CssSelect(".table-of-content .head-row td.download a.text-pdf").Single().Attributes["href"].Value).ToString();
}


Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow
¿Es esto KB legal? Sí, aprende por qué
Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow
¿Es esto KB legal? Sí, aprende por qué