Html Agility Pack将表解析为对象

c# foreach html-agility-pack html-parsing

所以我有这样的HTML:

<tr class="row1">
        <td class="id">123</td>
        <td class="date">2014-08-08</td>
        <td class="time">12:31:25</td>
        <td class="notes">something here</td>
</tr>
<tr class="row0">
        <td class="id">432</td>
        <td class="date">2015-02-09</td>
        <td class="time">12:22:21</td>
        <td class="notes">something here</td>
</tr>

对于每个客户行,它会继续这样。我想将每个表行的内容解析为一个对象。我尝试了很少的方法,但我似乎无法正常工作。

这就是我目前所拥有的

HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(html);
foreach (HtmlNode row in doc.DocumentNode.SelectNodes("//table[@id='customerlist']//tr"))
{
    Customer cust = new Customer();
    foreach (HtmlNode info in row.SelectNodes("//td"))
    {
        if (info.GetAttributeValue("class", String.Empty) == "id")
        {
            cust.ID = info.InnerText;
        }
        if (info.GetAttributeValue("class", String.Empty) == "date")
        {
            cust.DateAdded = info.InnerText;
        }
        if (info.GetAttributeValue("class", String.Empty) == "time")
        {
            cust.TimeAdded = info.InnerText;
        }
        if (info.GetAttributeValue("class", String.Empty) == "notes")
        {
            cust.Notes = info.InnerText;
        }
    }
    Console.WriteLine(cust.ID + " " + cust.TimeAdded + " " + cust.DateAdded + " " + cust.Notes);
}

它的工作原理是它在每个循环上打印表格最后一行的信息。我只是错过了一些非常简单但却看不清楚的东西。

我的创建对象的方式也很好,或者我应该使用构造函数并从变量创建对象?例如

    string Notes = String.Empty;
if (info.GetAttributeValue("class", String.Empty) == "notes")
{
    Notes = info.InnerText;
}
..
Customer cust = new Customer(id, other_variables, Notes, etc);

热门答案

您的XPath查询是错误的。您需要使用td而不是//td

foreach (HtmlNode info in row.SelectNodes("td"))

//td传递给SelectNodes()将匹配文档中的所有 <td>元素,因此内部循环运行8次而不是4次,最后4次始终覆盖先前在Customer对象中设置的值。

请参阅XPath示例



Related

许可下: CC-BY-SA with attribution
不隶属于 Stack Overflow
许可下: CC-BY-SA with attribution
不隶属于 Stack Overflow