Table de boucles de paquets d'agilité HTML - Obtenir une valeur de cellule basée sur la valeur de cellule précédente

c# html-agility-pack phantomjs selenium-webdriver web-scraping

Question

J'ai plusieurs tables et la valeur d'emplacement est donnée dans un ordre d'index différent. Comment puis-je obtenir la valeur d'emplacement si la chaîne de cellule précédente est "Emplacement" lorsque je parcours en boucle un tableau? Sur l'exemple ci-dessous, il s'agit des cellules [7], mais sur un autre tableau, ce sera 9. Comment puis-je conditionnellement obtenir des valeurs après que le texte intérieur des cellules est "Emplacement"? En gros, la cellule "Emplacement" contient le texte intérieur de la cellule suivante.

Tableau HTML:

<table class="tbfix FieldsTable"">
<tbody>
    <tr>
        <td class="name">Last Movement</td>
        <td class="value">Port Exit</td>
    </tr>
    <tr>
        <td class="name">Date</td>
        <td class="value">26/06/2017 00:00:00</td>
    </tr>
    <tr>
        <td class="name">From</td>
        <td class="value">HAMBURGE</td>
    </tr>
    <tr>
        <td class="name">Location</td>
        <td class="value">EUROGATE  HAMBURG</td>
    </tr>
    <tr>
        <td class="name">E/F</td>
        <td class="value">E</td>
    </tr>
</tbody>

Contrôleur en boucle:

foreach (var eachNode in driver.FindElements(By.XPath("//table[contains(descendant::*, 'Last Movement')]")))
                {
                    var cells = eachNode.FindElements(By.XPath(".//td"));
                    cd = new Detail();

                    for (int i = 0; i < cells.Count(); i++)
                    {
                        cd.ActionType = cells[1].Text.Trim();
                        string s = cells[3].Text.Trim();
                        DateTime dt = Convert.ToDateTime(s);
                        if (_minDate > dt) _minDate = dt;
                        cd.ActionDate = dt;

                    }
                }

Réponse acceptée

Dans votre boucle foreach, vous pouvez utiliser ceci:

var location = eachNode.FindElement(By.XPath(".//td[contains(text(),'Location')]/following-sibling::td));

Réponse populaire

En supposant que vos données soient toujours structurées de la sorte, je passerais en boucle sur toutes les étiquettes et ajouterais les données à un dictionnaire.

Essayez quelque chose comme ça:

Dictionary<string,string> tableData = new Dictionary<string, string>();
var trNodes = eachNode.FindElements(By.TagName("tr"));

foreach (var trNode in trNodes)
{
    var name = trNode.FindElement(By.CssSelector(".name")).Text.Trim();
    var value = trNode.FindElement(By.CssSelector(".value")).Text.Trim();

    tableData.Add(name,value);
}

var location = tableData["location"];

Vous devrez ajouter une validation et des vérifications pour le dictionnaire et la structure, mais c'est l'idée générale.



Related

Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow
Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow