Таблица анализа htmlAgilityPack в datatable или array

c# html-agility-pack linq

Вопрос

У меня есть эти таблицы:

<table>
<tbody>
<tr><th>Header 1</th></tr>
</tbody>
</table>

<table>
<tbody>
<tr>
<th>Header 1</th>
<th>Header 2</th>
<th>Header 3</th>
<th>Header 4</th>
<th>Header 5</th>
</tr>
<tr>
<td>text 1</td>
<td>text 2</td>
<td>text 3</td>
<td>text 4</td>
<td>text 5</td>
</tr>
</tbody>
</table>

Я пытаюсь преобразовать в массив или Список, используя этот код:

var query = from table in doc.DocumentNode.SelectNodes("//table").Cast<HtmlNode>()
                         from row in table.SelectNodes("tr").Cast<HtmlNode>()
                         from header in row.SelectNodes("th").Cast<HtmlNode>()
                         from cell in row.SelectNodes("td").Cast<HtmlNode>()
                         select new { 
                             Table = table.Id, 
                             Row = row.InnerText, 
                             Header = header.InnerText,
                             CellText = cell.InnerText
                         };

Но это не сработает. Что не так?

Принятый ответ

Некоторые примечания:

  • Вам не нужен актерский состав
  • вы предполагаете, что каждая строка имеет заголовки
  • SelectNodes должен получить xpath, и вы передаете только имена

если бы я был вами, я бы использовал foreach и моделировал свои данные, таким образом я получаю больше контроля и эффективности, но если вы все еще хотите сделать это по-своему, вот как это должно быть

var query = from table in doc.DocumentNode.SelectNodes("//table")
                        where table.Descendants("tr").Count() > 1 //make sure there are rows other than header row
                        from row in table.SelectNodes((".//tr[position()>1]")) //skip the header row
                        from cell in row.SelectNodes(("./td")) 
                        from header in table.SelectNodes(".//tr[1]/th") //select the header row cells which is the first tr
                        select new
                        {
                            Table = table.Id,
                            Row = row.InnerText,
                            Header = header.InnerText,
                            CellText = cell.InnerText
                        };


Related

Лицензировано согласно: CC-BY-SA with attribution
Не связан с Stack Overflow
Лицензировано согласно: CC-BY-SA with attribution
Не связан с Stack Overflow