从没有id或类名的元素中获取文本

c# html-agility-pack

我正在尝试使用Html Agility Pack解析HTML代码。有没有可用的教程,或者有人可以告诉我如何从没有ID和没有课程的<td>中获取文本?

    <table id="results-table">
    <tr class="row1">
    <td>Diode Zener Single 12V 5% 1W 2-Pin DO-41 Bulk</td> 
    ...

每行包含10个不同的<td> 。谢谢!

热门答案

您可以尝试使用此XPATH查询table具有id="results-table"所有td

//table[@id='results-table']/tr/td

Firefox的Firepath可以帮助您制定XPATH,您可以从那里操作它。

示例代码如下

HtmlDocument doc = new HtmlDocument();
var fileName = @"..\..\..\docs\10960189.htm";
doc.Load(fileName);

var nodes = doc.DocumentNode.SelectNodes("//table[@id='results-table']/tr/td");

foreach (var node in nodes)
{
    Debug.WriteLine(node.InnerText);
}

HTH




许可下: CC-BY-SA with attribution
不隶属于 Stack Overflow
这个KB合法吗? 是的,了解原因
许可下: CC-BY-SA with attribution
不隶属于 Stack Overflow
这个KB合法吗? 是的,了解原因