Ich benutze Html Agility Pack, um HTML zu parsen und so Sachen zu rasieren, aber ich stieß auf einige schlimme Dinge: | Das ist mein Hintergrundcode
public static HtmlDocument GetXHtmlFromUri2(string uri)
{
HttpClient client = HttpClientFactory.Create(new CustomeHeaderHandler());
var htmlDoc = new HtmlDocument()
{
OptionCheckSyntax = true,
OptionFixNestedTags = true,
OptionAutoCloseOnEnd = true,
OptionReadEncoding = true,
OptionDefaultStreamEncoding = Encoding.UTF8,
};
htmlDoc.LoadHtml(client.GetStringAsync(uri).Result);
return htmlDoc;
}
Ich benutze HTML Agility für WebApi (Mvc4) und das ist Get Method Logic
//GET api/values
public string GetHtmlFlights()
{
var result = ClientFlightTabale.GetXHtmlFromUri2("http://ikiafids.ir/departureFA.html");
HtmlNode node = result.DocumentNode.SelectSingleNode("//table[1]/tbody/tr[1]");
string temp = node.FirstChild.InnerHtml.Trim();
return temp;
}
aber wenn ich diese Methode (von Browser und Fiddler) anrufe, begegnete Exceptions, mit diesem Thema:
Objektverweis nicht auf eine Instanz eines Objekts gesetzt, und diese Ausnahme betrifft diese Zeile
string temp = node.FirstChild.InnerHtml.Trim();
Kann mir bitte jemand helfen?
Ich denke du suchst so etwas:
var result = ClientFlightTabale.GetXHtmlFromUri2("http://ikiafids.ir/departureFA.html");
var tableNode = result.DocumentNode.SelectSingleNode("//table[1]");
var titles = tableNode.Descendants("th")
.Select(th => th.InnerText)
.ToList();
var table = tableNode.Descendants("tr").Skip(1)
.Select(tr => tr.Descendants("td")
.Select(td => td.InnerText)
.ToList())
.ToList();
Ich denke, dein Selektor ist falsch. Versuchen Sie es stattdessen?
result.DocumentNode.SelectSingleNode("//table/tr[1]")