Таблица анализа HTMLAgilityPack в другой ячейке таблицы

arraylist c# html-agility-pack

Вопрос

У меня есть следующая таблица:

<table>
    <tr><th>header1</th><th>header2</th><th>header3</th></tr>
    <tr><td>value01</td><td>value02</td><td>value03</td></tr>
    <tr><td>value11</td><td>value12</td><td>value13</td></tr>
    <tr>
        <td colspan="3">
            <table>
                <tr><td>subvalue01</td><td>subvalue02</td></tr>
            </table>
        </td>
    </tr>
</table>

Я использую этот код для сохранения значений ячейки основной таблицы в отдельных значениях массива ArrayList и подтаблицы в другом массиве ArrayList . Но мои значения ArrayList для значений подтаблицы сохраняют все значения, включая таблицу и подтаблицу:

foreach (HtmlNode table in hdoc.DocumentNode.SelectNodes("//table"))
{
    ///This is the table.
    foreach (HtmlNode row in table.SelectNodes("tr").Skip(1))
    {
        ///This is the row.
        foreach (HtmlNode cell in row.SelectNodes("th|td")) 
            ///can also use "th|td", but right now we ONLY need td
        {
            //This is the cell.
            if (cell.InnerHtml.Contains("<table>"))
            {
                foreach (HtmlNode subtable in cell.SelectNodes("//table"))
                {
                    foreach (HtmlNode subrow in subtable.SelectNodes("tr").Skip(1))
                    {
                        foreach (HtmlNode subcell in subrow.SelectNodes("th|td"))
                        {
                            arrSubList.Add(subcell.InnerText);
                        }
                    }
                }
            }
            else
            {
                arrList.Add(cell.InnerText);
            }
        }
    }
}

Что не так с моим кодом?

Принятый ответ

Я считаю, что ваша первая строка

foreach (HtmlNode table in hdoc.DocumentNode.SelectNodes("//table"))

выберете ВСЕ таблицы - на любом уровне (включая вложенные таблицы).

Per: http://www.w3schools.com/XPath/xpath_syntax.asp

// Выбирает узлы в документе из текущего узла, которые соответствуют выбору, независимо от того, где они находятся

Итак, измените свою первую строку на

foreach (HtmlNode table in hdoc.DocumentNode.SelectNodes("/html/body/table"))

И посмотрим, как это происходит.



Лицензировано согласно: CC-BY-SA with attribution
Не связан с Stack Overflow
Является ли этот КБ законным? Да, узнайте, почему
Лицензировано согласно: CC-BY-SA with attribution
Не связан с Stack Overflow
Является ли этот КБ законным? Да, узнайте, почему