Html Agility Pack enlace y extracción de img src

c# html html-agility-pack

Pregunta

Tengo páginas que usan imágenes como enlaces, y estoy tratando de obtener el enlace href, así como las imágenes src. El problema es que lo que tengo ahora es recolectar la multa de href, pero solo está obteniendo el primer img src y solo repitiendo.

HtmlWeb hw = new HtmlWeb();
HtmlAgilityPack.HtmlDocument doc = hw.Load(url);
HtmlNodeCollection linkNodes = doc.DocumentNode.SelectNodes("//a[@href]");
foreach (HtmlNode linkNode in linkNodes)
{
HtmlAttribute link = linkNode.Attributes["href"];
HtmlNode imageNode = linkNode.SelectSingleNode("//img");
HtmlAttribute src = imageNode.Attributes["src"];

string imageLink = link.Value;
string imageUrl = src.Value;
}

¿Alguien puede decirme qué está mal u otra forma de hacerlo? Gracias.

Respuesta popular

Intenta cambiar

HtmlNode imageNode = linkNode.SelectSingleNode("//img");

a

HtmlNode imageNode = linkNode.SelectSingleNode(".//img");

Espero que esto ayude.



Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow
¿Es esto KB legal? Sí, aprende por qué
Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow
¿Es esto KB legal? Sí, aprende por qué