HtmlAgilityPack.HtmlWeb - 從帶有點的URL中抓取

.net c# html-agility-pack

我試圖從網站上抓取一些HTML。所有其他網址都有效,但其中一個尤其有問題。網址有一個點,這不是我可以改變的東西,因為它是別人的網站。

string url = "http://blahblah.com/over-under-2.5" // not the actual url!
HtmlWeb htmlWeb = new HtmlWeb();
var document = htmlWeb.Load(url);

它不會給出任何運行時錯誤,但返回的文檔為空。

有沒有解決方法?

熱門答案

使用Uri類創建您的URL。

Uri uri = new Uri("http://blahblah.com/over-under-2.5");
HtmlWeb htmlWeb = new HtmlWeb();
var page = htmlWeb.Load(uri.AbsoluteUri);
Console.WriteLine(page.DocumentNode.SelectSingleNode("//*[@id=\"currentpage\"]").InnerText);

這將從網頁輸出“BLAH”。




許可下: CC-BY-SA with attribution
不隸屬於 Stack Overflow
這個KB合法嗎? 是的,了解原因
許可下: CC-BY-SA with attribution
不隸屬於 Stack Overflow
這個KB合法嗎? 是的,了解原因