Obtenir du texte à partir d'éléments sans identifiant ni nom de classe

c# html-agility-pack

Question

J'essaie d'analyser le code HTML à l'aide de HTML Agility Pack. Existe-t-il un didacticiel disponible ou quelqu'un peut-il me dire comment obtenir un texte d'un <td> sans identifiant ni classe?

    <table id="results-table">
    <tr class="row1">
    <td>Diode Zener Single 12V 5% 1W 2-Pin DO-41 Bulk</td> 
    ...

Chaque ligne contient 10 <td> . Merci!

Réponse populaire

Vous pouvez essayer d’utiliser cette XPATH pour interroger tous les td de votre table ayant id="results-table"

//table[@id='results-table']/tr/td

Firepath pour Firefox peut vous aider à formuler XPATH et vous pouvez le manipuler à partir de là.

Exemple de code ci-dessous

HtmlDocument doc = new HtmlDocument();
var fileName = @"..\..\..\docs\10960189.htm";
doc.Load(fileName);

var nodes = doc.DocumentNode.SelectNodes("//table[@id='results-table']/tr/td");

foreach (var node in nodes)
{
    Debug.WriteLine(node.InnerText);
}

HTH



Related

Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow
Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow