私はhtmlの敏捷性パックとこのxpathを使用して、HTML文書から特定の画像を取得しようとしています:
//div[@id='topslot']/a/img/@src
私が見る限り、src属性を見つけますが、imgタグを返します。何故ですか?
私は、InnerHtml / InnerTextまたは何かが設定されることを期待しますが、どちらも空の文字列です。 OuterHtmlは完全なimg-tagに設定されています。
Html Agility Packのドキュメントはありますか?
代わりにHtmlNavigator
を使用すると、属性を直接取得できます。
//Load document from some html string
HtmlDocument hdoc = new HtmlDocument();
hdoc.LoadHtml(htmlContent);
//Load navigator for current document
HtmlNodeNavigator navigator = (HtmlNodeNavigator)hdoc.CreateNavigator();
//Get value from given xpath
string xpath = "//div[@id='topslot']/a/img/@src";
string val = navigator.SelectSingleNode(xpath).Value;