Comment analyser le HTMLDocument en c #?

asp.net c# html-agility-pack

Question

Je veux obtenir le texte d'une page HTML en utilisant une application simple en c #? S'il y a des éléments imbriqués, c'est-à-dire,

<Table>
    <TR>
        <TD>**ABC**
        </TD>
        <TD>**1**
        </TD>
   </TR>
   <TR>
        <TD>**XYZ**
        </TD>
        <TD>**2**
        </TD>
   </TR>
</Table>

Comment puis-je obtenir le texte (gras) directement des valeurs.Je veux les enregistrer dans ma base de données et aussi afficher dans gridview

 HtmlDocument htmlSnippet = new HtmlDocument();
 htmlSnippet = LoadHtmlSnippetFromFile();

 private HtmlDocument LoadHtmlSnippetFromFile()
 {
     //TextReader reader = File.OpenText(Server.MapPath("~/App_Data/HtmlSnippet.txt"));

     WebClient webClient = new WebClient();
     const string strUrl = "http://www.dsebd.org/latest_PE_all2_08.php";

     Stream reader = webClient.OpenRead(strUrl);

     HtmlDocument doc = new HtmlDocument();
     doc.Load(reader);

     reader.Close();

     return doc;
}

De cette htmlSnippet comment pourrais-je obtenir la valeur?

Réponse populaire

Je ne suis pas sûr de ce dont vous avez besoin ... compte tenu de votre exemple, voulez-vous une chaîne "**ABC****1****XYZ****2**" ?

Cela devrait alors fonctionner: htmlSnippet.Body.OuterText

EDIT: Ok, essayons de donner un exemple pour des valeurs séparées ...

HtmlElement tableElement = FindElement(HtmlDocument.Body, "table");
foreach(HtmlElement row in tableElement.Children)
{
    if (row.Name.ToLower() == "tr")
    {
        // create whatever class you use for a row
        foreach(HtmlElement cell in row.Children)
        {
            if (cell.Name.ToLower() == "td")
            {
                // add a new cell to your row using cell.InnerText
            }
        }
    }
}

// *** snip ***

private HtmlElement FindElement(HtmlElement element, string name)
{
    if (element.Name.ToLower() == name)
    {
        return element;
    }
    foreach(HtmlElement child in element.Children)
    {
        HtmlElement test = FindElement(test, name);
        if (test != null)
        {
            return test;
        }
    }
    return null;
}

Désolé, je n'ai pas de Visual Studio ici pour tester le code ... bonne chance ;-)




Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow
Est-ce KB légal? Oui, apprenez pourquoi
Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow
Est-ce KB légal? Oui, apprenez pourquoi