Recuperar todos los enlaces en una búsqueda de google

c# html-agility-pack selenium

Pregunta

Estoy intentando recuperar todos los enlaces de una búsqueda de google pero sin éxito ...

Estoy usando Selenium + HTML Agility Pack

HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(pageSource);

foreach (HtmlNode link in doc.DocumentNode.SelectNodes("//*[@id='rso']/div/div/div[1]/div/div/h3/a"))
{
     string href = link.GetAttributeValue("data-href", string.Empty);

     list.Add(href);
}

foreach (var item in list)
{
     Console.WriteLine(item);
}

Google HTML

<a href="/url?sa=t&amp;rct=j&amp;q=&amp;esrc=s&amp;source=web&amp;cd=2&amp;cad=rja&amp;uact=8&amp;ved=0ahUKEwizrv_f06TWAhXLD5AKHa4pB1AQFgg3MAE&amp;url=http%3A%2F%2Fwww.rtl.de%2Fcms%2Fdsds-2017-das-sind-die-votingergebnisse-der-14-staffel-4112962.html&amp;usg=AFQjCNF_sFs_fpNAeBAPLitsVZbShMAhiw" onmousedown="return rwt(this,'','','','2','AFQjCNF_sFs_fpNAeBAPLitsVZbShMAhiw','','0ahUKEwizrv_f06TWAhXLD5AKHa4pB1AQFgg3MAE','','',event)" data-href="http://www.rtl.de/cms/dsds-2017-das-sind-die-votingergebnisse-der-14-staffel-4112962.html">DSDS 2017: Das sind die Votingergebnisse der 14. Staffel - RTL.de</a>

Me gustaría extraer la fecha-href pero sin éxito.

Respuesta popular

No es el problema que de esta manera encuentres todos los enlaces.

Cuando agrega a[@data-href] a la XPath de SelectNodes , solo seleccionará los enlaces con un atributo de url de datos real en ellos.

Así se convertirá en:

foreach (HtmlNode link in doc.DocumentNode.SelectNodes("//*[@id='rso']/div/div/div[1]/div/div/h3/a[@data-href]")) 
{ 
    string href = link.GetAttributeValue("data-href", string.Empty); 
    list.Add(href); 
}


Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow
¿Es esto KB legal? Sí, aprende por qué
Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow
¿Es esto KB legal? Sí, aprende por qué