obtener texto de todos

en div htmlagilitypack

.net html-agility-pack parsing winforms

Pregunta

Tengo un div que contiene etiquetas de párrafo como esta

<div class="div_5">
                <p>First Paragraph</p>
                <p>Second Paragraph</p>
                <p>Third Paragraph</p>
                <p>Fourth Paragraph</p>
 </div>
<div class="div_5">
                <p>First Paragraph</p>
                <p>Second Paragraph</p>
                <p>Third Paragraph</p>
                <p>Fourth Paragraph</p>
 </div>

Necesito obtener el texto de todo el texto paragrap usando htmlagiitypack. Probé esto.

Dim oPB As HAP.HtmlNodeCollection = doc.DocumentNode.SelectNodes("//div[@class='post-bodycopy clearfix']/child::text()/"]
For Each item As HAP.HtmlNode In oPB
                    debug.print(item.InnerText)
                Next

La salida que estoy esperando para cada cadena div es

First Paragraph
Second Paragraph
Third Paragraph
Fourth Paragraph

pero estoy obteniendo algunos html en el texto devuelto, ¿puede alguien ayudarme a corregir el problema?

Respuesta aceptada

Tienes que seleccionar el texto interno de los párrafos. Tu xpath obtiene algo más completamente.

Dim query = doc.DocumentNode.SelectNodes("//div[@class='div_5']/p/text()")


Related

Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow
¿Es esto KB legal? Sí, aprende por qué
Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow
¿Es esto KB legal? Sí, aprende por qué