Tabla de análisis HTMLAgilityPack dentro de otra celda de tabla

arraylist c# html-agility-pack

Pregunta

Tengo la siguiente tabla:

<table>
    <tr><th>header1</th><th>header2</th><th>header3</th></tr>
    <tr><td>value01</td><td>value02</td><td>value03</td></tr>
    <tr><td>value11</td><td>value12</td><td>value13</td></tr>
    <tr>
        <td colspan="3">
            <table>
                <tr><td>subvalue01</td><td>subvalue02</td></tr>
            </table>
        </td>
    </tr>
</table>

Estoy usando este código para guardar los valores de celda de la tabla principal en ArrayList separados y valores de celda de subtabla en otro ArrayList . Pero mi ArrayList para valores de celda de subtabla está guardando los valores completos, incluyendo tabla y subtabla:

foreach (HtmlNode table in hdoc.DocumentNode.SelectNodes("//table"))
{
    ///This is the table.
    foreach (HtmlNode row in table.SelectNodes("tr").Skip(1))
    {
        ///This is the row.
        foreach (HtmlNode cell in row.SelectNodes("th|td")) 
            ///can also use "th|td", but right now we ONLY need td
        {
            //This is the cell.
            if (cell.InnerHtml.Contains("<table>"))
            {
                foreach (HtmlNode subtable in cell.SelectNodes("//table"))
                {
                    foreach (HtmlNode subrow in subtable.SelectNodes("tr").Skip(1))
                    {
                        foreach (HtmlNode subcell in subrow.SelectNodes("th|td"))
                        {
                            arrSubList.Add(subcell.InnerText);
                        }
                    }
                }
            }
            else
            {
                arrList.Add(cell.InnerText);
            }
        }
    }
}

¿Qué está mal con mi código?

Respuesta aceptada

Creo tu primera linea

foreach (HtmlNode table in hdoc.DocumentNode.SelectNodes("//table"))

seleccionará TODAS las tablas - en cualquier nivel (incluidas las tablas anidadas).

Por: http://www.w3schools.com/XPath/xpath_syntax.asp

// Selecciona los nodos en el documento del nodo actual que coinciden con la selección sin importar dónde estén

Entonces, cambia tu primera línea a

foreach (HtmlNode table in hdoc.DocumentNode.SelectNodes("/html/body/table"))

Y ver cómo va eso.



Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow
¿Es esto KB legal? Sí, aprende por qué
Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow
¿Es esto KB legal? Sí, aprende por qué