Necesito analizar HTML, pero tengo problemas.
Necesito obtener de este código html imgSRC
y text
<div class="div1Class">
<div id="div1ID">
<div class="div3Class">
<ul>
<li>
<img src="imgSRC"/>
<div>
<h3 class="subject">text</h3>
</div>
</li>
</ul>
</div>
</div>
</div>
HtmlAgilityPack
y su DocumentNode
, pero no sé cómo funciona.
Gracias de antemano.
Para su html, descrito anteriormente, puede usar este código:
HtmlDocument document = new HtmlDocument();
//your html stream
document.Load(stream);
var container = document.DocumentNode.Descendants("div").FirstOrDefault(x => x.Attributes.Contains("class") && x.Attributes["class"].Value == "div3Class");
if (container != null)
{
var image = container.Descendants("img").FirstOrDefault(x => x.Attributes.Contains("src"));
if (image != null)
{
var imageSrcValue = image.Attributes["src"].Value;
}
var subjectItem = container.Descendants("h3").FirstOrDefault(x => x.Attributes.Contains("class") && x.Attributes["class"].Value == "subject");
if (subjectItem != null)
{
var subjectItemValue = subjectItem.InnerText;
}
}