Html Agility Pack链接和img src提取

c# html html-agility-pack

我有使用图像作为链接的页面,我正在尝试获取href链接以及图像src。问题是我现在正在收集href的罚款,但它只是获得第一个img src并且只是重复。

HtmlWeb hw = new HtmlWeb();
HtmlAgilityPack.HtmlDocument doc = hw.Load(url);
HtmlNodeCollection linkNodes = doc.DocumentNode.SelectNodes("//a[@href]");
foreach (HtmlNode linkNode in linkNodes)
{
HtmlAttribute link = linkNode.Attributes["href"];
HtmlNode imageNode = linkNode.SelectSingleNode("//img");
HtmlAttribute src = imageNode.Attributes["src"];

string imageLink = link.Value;
string imageUrl = src.Value;
}

有人可以告诉我什么是错的或其他方式吗?谢谢。

热门答案

尝试改变

HtmlNode imageNode = linkNode.SelectSingleNode("//img");

HtmlNode imageNode = linkNode.SelectSingleNode("//img");

希望这可以帮助。




许可下: CC-BY-SA with attribution
不隶属于 Stack Overflow
这个KB合法吗? 是的,了解原因
许可下: CC-BY-SA with attribution
不隶属于 Stack Overflow
这个KB合法吗? 是的,了解原因