我正在使用WebService worker角色的HtmlAgilityPack解析xml,但是出了点问题。当我选择childnode“link”获取空char时。像xml一样:
<link>
http://www.webtekno.com/google/google-ve-razer-dan-oyun-konsolu.html
</link>
我从rss获取链接的代码是:
HtmlNodeCollection nodeList = doc.DocumentNode.SelectNodes("//item");
foreach (HtmlNode node in nodeList)
{
string newsUri = node.ChildNodes["link"].InnerText;
}
我认为获取空char导致链接节点包括新行和链接后。如何在节点中获取链接?
在加载HtmlDocument之前放入该行
HtmlNode.ElementsFlags["link"] = HtmlElementFlag.Closed;
就这些。
默认情况下,它的值是HtmlElementFlag.Empty
并被视为meta
和img
标签...