obtenir la valeur d'une table dans une page Web à l'aide de HTML Agility Pack sans utiliser "SelectNode"

c# c#-4.0 html html-agility-pack windows-store-apps

Question

J'essaie d'obtenir toute la valeur de la "Transaction et obtenir l'URL" à l'aide du Pack d'agilité HTML. Lorsque j'inspecte la source HTML à l'aide de Google, je suis en mesure de voir l'identifiant de transaction complet avec une URL. Ma question est de savoir comment puis-je obtenir la valeur totale de toutes les transactions et l'url qui leur est associé et les ajouter à mon datagridusing Async. Je ne parviens pas à utiliser "SelectNode" car il n'est pas pris en charge par les applications Windows Store. ## Heading ##

voici l'url du site: http://explorer.litecoin.net/address/LeDGemnpqQjrK8v1s5HZKaDgjgDKQ2MYiK

async private void GetTransactions()
{
    url = "http://explorer.litecoin.net/address/LeDGemnpqQjrK8v1s5HZKaDgjgDKQ2MYiK";
    string html;

    HttpWebRequest req = (HttpWebRequest)WebRequest.Create(url);
    try
    {
        WebResponse x = await req.GetResponseAsync();
        HttpWebResponse res = (HttpWebResponse)x;
        if (res != null)
        {
            if (res.StatusCode == HttpStatusCode.OK)
            {
                Stream stream = res.GetResponseStream();
                using (StreamReader reader = new StreamReader(stream))
                {
                    html = reader.ReadToEnd();
                }
                HtmlDocument htmlDocument = new HtmlDocument();
                htmlDocument.LoadHtml(html);

               var tsTable = htmlDocument.DocumentNode.ChildNodes["html"].ChildNodes["body"].ChildNodes["div"].
                        ChildNodes["div"].ChildNodes["div"].ChildNodes["table"].InnerHtml;

                    int n = 2;
                    var tsRow = tsTable.Split(Environment.NewLine.ToCharArray()).Skip(n).ToArray();

                    for (var index = 1; index < tsRow.Count(); index++)
                    {

                    }
            }
        }
    }
    catch
    {
        MessageDialog messageDialog =
            new MessageDialog("A tear occured in the space-time continuum. Please try again when all planets in the solar system are aligned.");
    }
}
<telerikGrid:RadDataGrid Grid.RowSpan="1"  ItemsSource="{Binding Data}" IsSynchronizedWithCurrentItem="True" AlternateRowBackground="AliceBlue" Background="White" Grid.Row="2" 
                         UserEditMode="Inline" UserGroupMode="Disabled" VerticalAlignment="Bottom" AutoGenerateColumns="False" Height="294" Grid.ColumnSpan="2">
    <telerikGrid:RadDataGrid.GroupDescriptors>
        <telerikGrid:PropertyGroupDescriptor PropertyName="Group"/>
    </telerikGrid:RadDataGrid.GroupDescriptors>
    <telerikGrid:RadDataGrid.Columns>
        <telerikGrid:DataGridNumericalColumn PropertyName="Id" CanUserEdit="False" CanUserFilter="False" Header="#" SizeMode="Fixed" Width="40"/>
        <telerikGrid:DataGridTextColumn PropertyName="pnDate" CanUserFilter="False" Header="Date" CellContentFormat="{}{0,0:dd.MM.yyyy}"/>
        <telerikGrid:DataGridNumericalColumn PropertyName="pnType" CanUserFilter="False" Header="Type"/>
        <telerikGrid:DataGridTextColumn PropertyName="pnAddress" CanUserFilter="False" Header="Address"/>
        <telerikGrid:DataGridDateColumn PropertyName="pnAmount" CanUserFilter="False" Header="Amount"/>
    </telerikGrid:RadDataGrid.Columns>
</telerikGrid:RadDataGrid>

Réponse acceptée

SelectNode (avec une requête XPath) fait juste sa propre chose d'itérer à travers les nœuds et de faire correspondre les choses. Vous devez simplement le faire à la main, en regardant le code HTML lui-même et en vous créant un chemin pour atteindre ce que vous voulez.

var table = htmlDocument.DocumentNode.ChildNodes["html"].ChildNodes["Body"].ChildNodes[0].ChildNodes[0].ChildNodes[0].ChildNodes["Table"];

Maintenant que vous avez la table (et que vous auriez pu être plus spécifique avec les ChildNodes, comme rechercher la Div avec une valeur d'attribut de classe spécifique), vous pouvez commencer à regarder les lignes. La première rangée est les en-têtes, on s'en fiche.

// The first table row is index 0 and looks like this:
// <tr><th>Transaction</th><th>Block</th><th>Approx. Time</th><th>Amount</th><th>Balance</th><th>Currency</th></tr>
// It is the column headers, each <th> node represents a column. The foreach below starts at index 1, the first row of real data...
foreach(var index = 1; index < table.ChildNodes.Count; index++)
{
    // a row of data looks like:
    // <tr><td><a href="../tx/513.cut for space.b4a#o1">5130f066e0...</a></td><td><a href="../block/c3.cut for space.c9c">468275</a></td><td>2013-11-28 09:14:17</td><td>0.3</td><td>0.3</td><td>LTC</td></tr>
    // each <td> node inside of the row, is the matching data for the column index...
    var row = table.ChildNodes[index];
    var transactionLink = row.ChildNodes[0].ChildNodes["a"].Attributes["href"].Value;
    var transactionText = row.ChildNodes[0].ChildNodes["a"].InnerText;

    // Other variables for the table row data... 
    // Here is one more example
    var apporxTime = row.ChildNodes[2].InnerText;
}

Réponse populaire

c'est un sacré bidouillage, mais vous pouvez essayer d'utiliser l'analyse régulière suivante si vous êtes absolument certain de ne pas utiliser l'API mentionnée par @the_lotus.

\<td\>\s*\<a(?:.*)href="(?<url>[^"]*)"\>(?<block>[^<]*)\</a\>\s*\</td\>\s*\<td\>(?<date>[^<]*)\</td\>\s*\<td\>(?<amount>[^<]*)\</td\>\s*\<td\>(?<balance>[^<]*)\</td\>\s*\<td\>(?<currency>[^<]*)\</td\>


Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow
Est-ce KB légal? Oui, apprenez pourquoi
Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow
Est-ce KB légal? Oui, apprenez pourquoi