如何使用ScrapySharp來解析html文檔中的元素?

c# html html-agility-pack scrapysharp web-scraping

這是項目官方“文檔”:

https://bitbucket.org/rflechner/scrapysharp/wiki/Home


無論我嘗試什麼,我都找不到庫應該添加的CssSelect()方法,以便更容易查詢。這是我嘗試過的:

using ScrapySharp.Core;
using ScrapySharp.Html.Parsing;
using HtmlAgilityPack;

HtmlWeb web = new HtmlWeb();
HtmlDocument doc = web.Load("http://www.stackoverflow.com");

var page = doc.DocumentNode.SelectSingleNode("//body");
page.CssSel???

具體如何使用此庫?在文檔中,不清楚html是什麼類型。

一般承認的答案

using ScrapySharp.Extensions;

看起來你錯過了。這應該使CssSelect可用。

為了防止示例有幫助,這裡也是我在項目中使用的方法:

using ScrapySharp.Extensions;



許可下: CC-BY-SA with attribution
不隸屬於 Stack Overflow
這個KB合法嗎? 是的,了解原因
許可下: CC-BY-SA with attribution
不隸屬於 Stack Overflow
這個KB合法嗎? 是的,了解原因