我正在尝试使用Html Agility Pack解析HTML代码。有没有可用的教程,或者有人可以告诉我如何从没有ID和没有课程的<td>
中获取文本?
<table id="results-table">
<tr class="row1">
<td>Diode Zener Single 12V 5% 1W 2-Pin DO-41 Bulk</td>
...
每行包含10个不同的<td>
。谢谢!
您可以尝试使用此XPATH
查询table
具有id="results-table"
所有td
//table[@id='results-table']/tr/td
Firefox的Firepath可以帮助您制定XPATH,您可以从那里操作它。
示例代码如下
HtmlDocument doc = new HtmlDocument();
var fileName = @"..\..\..\docs\10960189.htm";
doc.Load(fileName);
var nodes = doc.DocumentNode.SelectNodes("//table[@id='results-table']/tr/td");
foreach (var node in nodes)
{
Debug.WriteLine(node.InnerText);
}
HTH