ottenere il testo di tutti

in div htmlagilitypack

.net html-agility-pack parsing winforms

Domanda

Ho un div che contiene tag di paragrafo come questo

<div class="div_5">
                <p>First Paragraph</p>
                <p>Second Paragraph</p>
                <p>Third Paragraph</p>
                <p>Fourth Paragraph</p>
 </div>
<div class="div_5">
                <p>First Paragraph</p>
                <p>Second Paragraph</p>
                <p>Third Paragraph</p>
                <p>Fourth Paragraph</p>
 </div>

ho bisogno di ottenere il testo di tutto il testo del paragrafo usando htmlagiitypack ho provato questo,

Dim oPB As HAP.HtmlNodeCollection = doc.DocumentNode.SelectNodes("//div[@class='post-bodycopy clearfix']/child::text()/"]
For Each item As HAP.HtmlNode In oPB
                    debug.print(item.InnerText)
                Next

l'output che mi aspetto per ogni stringa div è

First Paragraph
Second Paragraph
Third Paragraph
Fourth Paragraph

ma sto ricevendo del codice HTML nel testo restituito, qualcuno può aiutarmi a correggere il problema

Risposta accettata

Devi effettivamente selezionare il testo interno dei paragrafi. Il tuo xpath ottiene qualcos'altro completamente.

Dim query = doc.DocumentNode.SelectNodes("//div[@class='div_5']/p/text()")


Autorizzato sotto: CC-BY-SA with attribution
Non affiliato con Stack Overflow
È legale questo KB? Sì, impara il perché
Autorizzato sotto: CC-BY-SA with attribution
Non affiliato con Stack Overflow
È legale questo KB? Sì, impara il perché