Я пытаюсь захватить значение «href». Код выглядит примерно так:
<div class="s_newsbox" style="font-size:12px; vertical-align:middle; overflow: hidden; float:left; margin:10px; margin-bottom:15px; height: 270px; width:280px; border-radius:6px; position:relative; text-align:center; padding:0px">
<div style="background-color:#292929; background-color:rgba(0,0,0,0.8); padding:5px; padding-left:2px; padding-right:10px; width:100%; position:absolute; top:0; left:0;"><b>Samsung nx30 + zoom kit 18/55</b>
</div>
<a href="vendo.php?t=1395911">
<img style="width:100%; height:100%" src="http://img1.juzaphoto.com/shared_files/uploads_mercatino/sell_1395911_small.jpg" alt="">
<br></a>
<div style="line-height:150%; background-color:#292929; background-color:rgba(0,0,0,0.8); padding:5px; position:absolute; bottom:0; left:0; margin-left:auto; width:100%; text-align:left">Venditore:
<a href="me.php?l=it&p=45923"><b>Pierobob</b></a>
<br> Prezzo: <b>350 €</b>
<br> Zona: <b>Bologna</b>
<br>
<a href="vendo.php?t=1395911">Leggi annuncio</a> (8 visite)
<br>
</div>
</div>
То, что я пытаюсь сделать, это:
var list = page.DocumentNode.SelectNodes("//div[@class='s_newsbox']");
foreach (var obj in list)
{
var url = obj.SelectSingleNode(".//a").Attributes["href"].Value;
Я хочу захватить значение «vendo.php? T = 1395911», но вместо этого я получаю значение href другой строки, у которой нет родительского div с классом 's_newsbox'
Что я делаю неправильно?
Спасибо вам!
Вы можете фильтровать объекты, о которых идет речь, с более точным xpath, если вам не нужен какой-либо из других узлов внутри div s_newsbox.
var list = page.DocumentNode.SelectNodes("//div[@class='s_newsbox']/a[string-length(@href)>0]");
foreach (var obj in list)
{
var url = obj.SelectSingleNode(".").Attributes["href"].Value;