Я новичок в HTML Agility pack, и я не понял, как я могу разобрать следующий блок кода:
<p>
<div class='myclass1'>
<div id='idXXXX'>content1<br>content2
</div>
<div class="myclass2">
<table>
<tr>
<td align="left">content3 <b><a href="">content4</a></b></td>
<td align="right">content5 <b><a href="">content6</a></b></td>
</tr>
</table>
</div>
</div>
</p>
где XXXX - случайное сгенерированное число.
У меня есть весь код для загрузки HTML-документа.
То, что я хочу от вышеуказанного кода, - это получить контент 1 и 2 и другой контент запроса4.
var doc = new HtmlDocument();
doc.Load("test.htm");
var res = doc.DocumentNode.SelectSingleNode("//div[@class='myclass1']");
var firstDiv = res.SelectSingleNode("div");
var content1 = firstDiv.ChildNodes[0].InnerText.Trim();
var content2 = firstDiv.ChildNodes[2].InnerText.Trim();
var content4 = res.SelectSingleNode(".//div[@class='myclass2']")
.SelectSingleNode(".//td[@align='left']/b/a")
.InnerText
.Trim();
ОБНОВИТЬ:
Если у вас есть несколько div с данными классами, и вы хотите, чтобы они соответствовали содержимому для каждого из них, вы могли бы сделать это:
var doc = new HtmlDocument();
doc.Load("test.htm");
var res = doc.DocumentNode.SelectNodes("//div[@class='myclass1']");
foreach (var item in res)
{
var firstDiv = item.SelectSingleNode("div");
var content1 = firstDiv.ChildNodes[0].InnerText.Trim();
var content2 = firstDiv.ChildNodes[2].InnerText.Trim();
var content4 = item.SelectSingleNode(".//div[@class='myclass2']")
.SelectSingleNode(".//td[@align='left']/b/a")
.InnerText
.Trim();
}