У меня есть пара проблем с моим кодом, я пытаюсь вытащить каждый абзац со страницы, но на данный момент он выбирает только последний абзац.
вот мой код.
foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//div[@id='body']/p"))
{
string text = node.InnerText;
lblTest2.Text = text;
}
В вашем цикле вы берете текущий узел innerText и присваиваете его метке. Вы делаете это с каждым узлом, поэтому, конечно, вы видите только последний - вы не сохраняете предыдущие.
Попробуй это:
foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//div[@id='body']/p"))
{
string text = node.InnerText;
lblTest2.Text += text + Environment.NewLine;
}
ИМО, XPath - не забава. Вместо этого я рекомендую использовать синтаксис LINQ:
foreach (var node in doc.DocumentNode
.DescendantNodes()
.Single(x => x.Id == "body")
.DescendantNodes()
.Where(x => x.Name == "p"))
{
string text = node.InnerText;
lblTest2.Text = text;
}