Analizza tabella con HTML Agility Pack

c# html-agility-pack html-table

Domanda

Nel seguente HTML, posso analizzare l'elemento table , ma non so come saltare gli elementi th .

Voglio ottenere solo gli elementi td , ma quando provo a usare:

foreach (HtmlNode cell in row.SelectNodes("td"))

... ho un'eccezione

foreach (HtmlNode cell in row.SelectNodes("td"))

Il mio codice:

foreach (HtmlNode cell in row.SelectNodes("td"))

Risposta accettata

Questo metodo utilizza LINQ per HtmlNode istanze HtmlNode con il nome td .

Ho anche notato che il tuo output appare come val|val| (con il tubo finale), Questo esempio utilizza string.Join(pipe, array) come metodo meno odioso di rimozione di quel tubo finale: val|val .

using System.Linq;

// ...

var tablecollection = doc.DocumentNode.SelectNodes("//table");
string store = string.Empty;

if (tablecollection != null)
{
    foreach (HtmlNode table in tablecollection)
    {
        // For all rows with at least one child with the 'td' tag.
        foreach (HtmlNode row in table.DescendantNodes()
            .Where(desc =>
                desc.Name.Equals("tr", StringComparison.OrdinalIgnoreCase) &&
                desc.DescendantNodes().Any(child => child.Name.Equals("td",
                    StringComparison.OrdinalIgnoreCase))))
        {
            // Combine the child 'td' elements into an array, join with the pipe
            // to create the output in 'val|val|val' format.
            store = string.Join("|", row.DescendantNodes().Where(desc =>
                desc.Name.Equals("td", StringComparison.OrdinalIgnoreCase))
                .Select(desc => desc.InnerText));

            // You can probably get rid of the 'store' variable as it's
            // no longer necessary to store the value of the table's
            // cells over the iteration.
            sw.Write(store);
            sw.WriteLine();
        }
    }
}

sw.Flush();
sw.Close(); 

Risposta popolare

La sintassi XPath non è corretta. Per favore prova:

HtmlNode cell in row.SelectNodes("//td")

Questo ti porterà la collezione di elementi td che possono essere iterati con foreach .




Autorizzato sotto: CC-BY-SA with attribution
Non affiliato con Stack Overflow
È legale questo KB? Sì, impara il perché
Autorizzato sotto: CC-BY-SA with attribution
Non affiliato con Stack Overflow
È legale questo KB? Sì, impara il perché