Получение данных из таблицы HTML в datatable

c# html html-agility-pack linq xpath

Вопрос

Хорошо, поэтому мне нужно запросить живой сайт, чтобы получить данные из таблицы, поместите эту таблицу HTML в DataTable и затем используйте эти данные. До сих пор мне удалось использовать Html Agility Pack и XPath для доступа к каждой строке в таблице, в которой я нуждаюсь, но я знаю, что должен быть способ проанализировать ее в DataTable. (C #) Код, который я использую сейчас:

string htmlCode = "";
using (WebClient client = new WebClient())
{
htmlCode = client.DownloadString("http://www.website.com");
}
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();

doc.LoadHtml(htmlCode);

//My attempt at LINQ to solve the issue (not sure where to go from here)
var myTable = doc.DocumentNode
.Descendants("table")
.Where(t =>t.Attributes["summary"].Value == "Table One")
.FirstOrDefault();

//Finds all the odd rows (which are the ones I actually need but would prefer a
//DataTable containing all the rows!
foreach (HtmlNode cell in doc.DocumentNode.SelectNodes("//tr[@class='odd']/td"))
{
string test = cell.InnerText;
//Have not gone further than this yet!
}

Таблица HTML на веб-сайте, на который я запрашиваю, выглядит так:

<table summary="Table One">
<tbody>
<tr class="odd">
<td>Some Text</td>
<td>Some Value</td>
</tr>
<tr class="even">
<td>Some Text1</td>
<td>Some Value1</td>
</tr>
<tr class="odd">
<td>Some Text2</td>
<td>Some Value2</td>
</tr>
<tr class="even">
<td>Some Text3</td>
<td>Some Value3</td>
</tr>
<tr class="odd">
<td>Some Text4</td>
<td>Some Value4</td>
</tr>
</tbody>
</table>

Я не уверен, что лучше / проще использовать LINQ + HAP или XPath + HAP для получения желаемого результата, я пробовал работать с ограниченным успехом, как вы, вероятно, видите. Это первый раз, когда я когда-либо делал программу для запроса веб-сайта или даже взаимодействовал с веб-сайтом каким-либо образом, поэтому я очень не уверен в данный момент! Спасибо за любую помощь заранее :)

Принятый ответ

Нет такого метода из коробки из пакета Agility Pack, но его не должно быть слишком сложно создать. Там есть образцы, которые делают XML для Datatable из Linq-to-XML. Они могут быть переработаны в то, что вам нужно.

При необходимости я могу помочь создать весь метод, но не сегодня :).

Смотрите также:


Популярные ответы

Используя некоторый код Джека Экера выше и некоторый код от Марка Гравелла ( см. Сообщение здесь ), мне удалось найти решение. Этот фрагмент кода используется для получения государственных праздников в 2012 году в Южной Африке на момент написания этой статьи

using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Drawing;
using System.Linq;
using System.Text;
using System.Windows.Forms;
using System.Web;
using System.Net;
using HtmlAgilityPack;



namespace WindowsFormsApplication
{
    public partial class Form1 : Form
    {
        private DataTable dt;
        public Form1()
        {
            InitializeComponent();
        }

        private void button1_Click(object sender, EventArgs e)
        {

            string htmlCode = "";
            using (WebClient client = new WebClient())
            {
                client.Headers.Add(HttpRequestHeader.UserAgent, "AvoidError");
                htmlCode = client.DownloadString("http://www.info.gov.za/aboutsa/holidays.htm");
            }
            HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();

            doc.LoadHtml(htmlCode);

            dt = new DataTable();
            dt.Columns.Add("Name", typeof(string));
            dt.Columns.Add("Value", typeof(string));

            int count = 0;


            foreach (HtmlNode table in doc.DocumentNode.SelectNodes("//table"))
            {

                foreach (HtmlNode row in table.SelectNodes("tr"))
                {

                    if (table.Id == "table2")
                    {
                        DataRow dr = dt.NewRow();

                        foreach (var cell in row.SelectNodes("td"))
                        {
                            if ((count % 2 == 0))
                            {
                                dr["Name"] = cell.InnerText.Replace("&nbsp;", " ");
                            }
                            else
                            {

                                dr["Value"] = cell.InnerText.Replace("&nbsp;", " ");

                                dt.Rows.Add(dr);
                            }
                            count++;

                        }


                    }

                }


                dataGridView1.DataSource = dt;

            }
        }

    }
}


Related

Лицензировано согласно: CC-BY-SA with attribution
Не связан с Stack Overflow
Является ли этот КБ законным? Да, узнайте, почему
Лицензировано согласно: CC-BY-SA with attribution
Не связан с Stack Overflow
Является ли этот КБ законным? Да, узнайте, почему