en div htmlagilitypack .net html-agility-pack parsing winforms
Tengo un div que contiene etiquetas de párrafo como esta
<div class="div_5">
<p>First Paragraph</p>
<p>Second Paragraph</p>
<p>Third Paragraph</p>
<p>Fourth Paragraph</p>
</div>
<div class="div_5">
<p>First Paragraph</p>
<p>Second Paragraph</p>
<p>Third Paragraph</p>
<p>Fourth Paragraph</p>
</div>
Necesito obtener el texto de todo el texto paragrap usando htmlagiitypack. Probé esto.
Dim oPB As HAP.HtmlNodeCollection = doc.DocumentNode.SelectNodes("//div[@class='post-bodycopy clearfix']/child::text()/"]
For Each item As HAP.HtmlNode In oPB
debug.print(item.InnerText)
Next
La salida que estoy esperando para cada cadena div es
First Paragraph
Second Paragraph
Third Paragraph
Fourth Paragraph
pero estoy obteniendo algunos html en el texto devuelto, ¿puede alguien ayudarme a corregir el problema?
Tienes que seleccionar el texto interno de los párrafos. Tu xpath obtiene algo más completamente.
Dim query = doc.DocumentNode.SelectNodes("//div[@class='div_5']/p/text()")