using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Net;
using HtmlAgilityPack;
namespace sss
{
public class Downloader
{
WebClient client = new WebClient();
public HtmlDocument FindMovie(string Title)
{
//This will be implemented later on, it will search movie.
}
public HtmlDocument FindKnownMovie(string ID)
{
HtmlDocument Page = (HtmlDocument)client.DownloadString(String.Format("http://www.imdb.com/title/{0}/", ID));
}
}
}
Comment convertir une chaîne téléchargée en un document HTML valide afin de pouvoir l'analyser à l'aide de HTMLAgilityPack?
Cela devrait fonctionner avec v1.4:
HtmlWeb hw = new HtmlWeb();
HtmlDocument doc = hw.Load(string.Format("http://www.imdb.com/title/{0}/", ID));
ou
string html = client.DownloadString(String.Format("http://www.imdb.com/title/{0}/", ID));
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(html);
Essayez ceci (basé sur ce document assez ancien ):
string url = String.Format("http://www.imdb.com/title/{0}/", ID);
string content = client.DownloadString(url);
HtmlDocument page = new HtmlDocument();
page.LoadHtml(content);
Fondamentalement, la conversion est rarement la bonne façon de convertir deux types de fichiers, en particulier lorsque des analyses similaires sont en cours.