получить текст всего

в div htmlagilitypack

.net html-agility-pack parsing winforms

Вопрос

У меня есть div, который содержит теги абзацев, подобные этому

<div class="div_5">
                <p>First Paragraph</p>
                <p>Second Paragraph</p>
                <p>Third Paragraph</p>
                <p>Fourth Paragraph</p>
 </div>
<div class="div_5">
                <p>First Paragraph</p>
                <p>Second Paragraph</p>
                <p>Third Paragraph</p>
                <p>Fourth Paragraph</p>
 </div>

Мне нужно получить текст всего текста paragrap, используя htmlagiitypack, я попробовал это,

Dim oPB As HAP.HtmlNodeCollection = doc.DocumentNode.SelectNodes("//div[@class='post-bodycopy clearfix']/child::text()/"]
For Each item As HAP.HtmlNode In oPB
                    debug.print(item.InnerText)
                Next

вывод, ожидаемый для каждой строки div,

First Paragraph
Second Paragraph
Third Paragraph
Fourth Paragraph

но я получаю некоторый html в возвращенном тексте, может кто-то помочь мне исправить проблему

Принятый ответ

Вы должны фактически выбрать внутренний текст абзаца. Ваш xpath получает что-то еще полностью.

Dim query = doc.DocumentNode.SelectNodes("//div[@class='div_5']/p/text()")


Related

Лицензировано согласно: CC-BY-SA with attribution
Не связан с Stack Overflow
Лицензировано согласно: CC-BY-SA with attribution
Не связан с Stack Overflow