Ich habe dieses bisschen HTML, das ich analysieren muss
<p class="feature_list">
<img src="candy.gif" alt="candy" title="candy"/>
x 3
<img src="lollies.gif" alt="lollies" title="lollies"/>
1
<img src="system.gif" alt="system" title="system"/>
x 1
<img src="phone.gif" alt="phone" title="phone"/>
x 1
</p>
Wie Sie sehen können, gibt es ein Bild und dann einen Text wie "x 3" daneben.
Ich möchte jedes Bild durchgehen und den Text daneben aufzeichnen. Der Text befindet sich jedoch außerhalb des Tags 'img'.
Ich habe mich gefragt, ob es überhaupt möglich ist, dies mit dem HTML Agility Pack zu tun?
Der folgende Code:
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.Load(yourHtml);
foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//img"))
{
Console.WriteLine(HtmlEntity.DeEntitize(node.NextSibling.InnerText).Trim());
}
Wird ausgegeben:
x 3
1
x 1
x 1
Beachten Sie das HtmlEntity-Dienstprogramm, das die Behandlung von HTML-Entitäten erleichtert (wie
)