HtmlAgilityPackの問題

c# html-agility-pack

質問

私はHtmlAgilityPackをマスターします。私はプリロードされたページからデータを取得しようとしています。すなわち、1.htmのページがあります。私は行 "オペレーティングシステム"の反対側のテーブルから値を取得したい。 (文書自体が添付されています)。私はこれをします:

private void simpleButton1_Click(object sender, EventArgs e)
        {
            // Создаю экземпляр класса
            HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
            // Загружаю файл
            doc.Load(@"D:\(тут путь к файлу)\1.htm");
            // Пытаюсь получить информацию из ноды, но получаю null
            HtmlAgilityPack.HtmlNode bodyNode = doc.DocumentNode.SelectSingleNode("//TD[@CLASS=pt]");
            ...

一般に、ファイルから多くの情報を抽出する必要がありますが、1つの線が得られればさらに類推すると思います。

必要な行は次のとおりです。

 private void simpleButton1_Click(object sender, EventArgs e)
        {
            // Создаю экземпляр класса
            HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
            // Загружаю файл
            doc.Load(@"D:\(тут путь к файлу)\1.htm");

            foreach (HtmlAgilityPack.HtmlNode node in doc.DocumentNode.SelectNodes("//body/table[2]/tr[8]/td[4]"))
            {
                string stroka = node.InnerText;
            }

しかし、このオプションは "額にある"。私の文書の構造を変更しない場合。検索の助けを借りてどのように可能かはまだ分かりません。

ファイル

受け入れられた回答

これはテーブルの名前の辞書を返します。各表は、最初の列がキー、2番目が値の辞書です。

var tables = new Dictionary<string, Dictionary<string, string>>();
var doc = new HtmlDocument();
doc.Load(@"D:\(тут путь к файлу)\1.htm", Encoding.GetEncoding(1251), false);
var tableNames = doc.DocumentNode.SelectNodes("//td[@class='pt']/a").Select(a=>a.Attributes["name"].Value);
foreach(string name in tableNames)
{
    var table = doc.DocumentNode.SelectSingleNode("//table[.//a[@name='" + name + "']]/following-sibling::table[1]");
    int columns = table.SelectNodes(".//tr[1]/td").Count();

    string[] keys = table.SelectNodes(".//tr/td["+(columns-1)+"]").Select(n => n.InnerText.Replace("&nbsp;"," ").Trim()).ToArray();
    string[] values = table.SelectNodes(".//tr/td["+columns+"]").Select(n => n.InnerText.Replace("&nbsp;"," ").Trim()).ToArray();
    var body = new Dictionary<string, string>();
    for (int i = 0; i < keys.Count(); i++)
    {
        string key = keys[i];
        if (body.ContainsKey(key))
            body[key] += ", " + values[i];
        else if( key!="" && values[i]!="")
            body[key] = values[i];

    }
    tables.Add(name, body);

}

たとえば、 tables["power management"]は4つのエントリを返します。

  • [0] {0} {0} {1} {0} {0} {0} {0} {0} {0} {0} {0} {0} {0} {0} {0} {0} {0} Generic.KeyValuePair
  • [1] {[] [] [] [] [] [] [] [] [] [] [] []
  • [2] {[ПолноÐμврÐμмÑÑабоÑ,Ñ<¾¾Ñ、баÑ、ÐЀÐμй、ÐÐÐÐÐÐÐÐÑÐÑ、ѽо]} System.Collections。 Generic.KeyValuePair
  • [3] {[Ð|Ñ|Ð|Ð|Ð|Ð|Ð|Ð|Ð|Ð|Ð|Ñ| System.Collections.Generic.KeyValuePair

tables["power management"]["Текущий Ð¸Ñ Ñ‚Ð¾Ñ‡Ð½Ð¸Ðº Ð¿Ð¸Ñ‚Ð°Ð½Ð¸Ñ "]戻り値:

"ÐлÐμкÑ,роÑÐμÑ,ÑŒ"

反復処理を行うには、次のようにします。

foreach(var tableName in tables.Keys)
{
    var table = tables[tableName];
    foreach(var key in table.Keys)
    {
        string value = table[key];
        Debug.Print(tableName + "/" + key + "/" + value);
    }
}


ライセンスを受けた: CC-BY-SA with attribution
所属していない Stack Overflow
このKBは合法ですか? はい、理由を学ぶ
ライセンスを受けた: CC-BY-SA with attribution
所属していない Stack Overflow
このKBは合法ですか? はい、理由を学ぶ