HtmlAgilityPack.HtmlWeb - scraping da un url con un punto in

.net c# html-agility-pack

Domanda

Sto provando a raschiare qualche html da un sito. Tutti gli altri URL funzionano, ma uno in particolare dà un problema. L'url ha un punto in, non è qualcosa che posso cambiare perché è il sito di qualcun altro.

string url = "http://blahblah.com/over-under-2.5" // not the actual url!
HtmlWeb htmlWeb = new HtmlWeb();
var document = htmlWeb.Load(url);

Non fornisce alcun errore di runtime ma il documento restituito è vuoto.

C'è qualche soluzione?

Risposta popolare

Usa la classe Uri per creare il tuo URL.

Uri uri = new Uri("http://blahblah.com/over-under-2.5");
HtmlWeb htmlWeb = new HtmlWeb();
var page = htmlWeb.Load(uri.AbsoluteUri);
Console.WriteLine(page.DocumentNode.SelectSingleNode("//*[@id=\"currentpage\"]").InnerText);

che genererà "BLAH" dalla pagina web.




Autorizzato sotto: CC-BY-SA with attribution
Non affiliato con Stack Overflow
È legale questo KB? Sì, impara il perché
Autorizzato sotto: CC-BY-SA with attribution
Non affiliato con Stack Overflow
È legale questo KB? Sì, impara il perché