C # - Holen Sie den Text in Tags mit HTML Agility Pack

c# html-agility-pack

Frage

Ich habe den folgenden Code verwendet, um HTML-Dokument zu analysieren und es als CSV-Datei zu speichern.

string actuald=null;
string data1 = File.ReadAllText("E://text.html");
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(data1);
HtmlNodeCollection col = doc.DocumentNode.SelectNodes("//pre");

foreach (HtmlNode node in col)
{
     actuald=node.Attributes[""].Value;
}
File.WriteAllText("E://text.csv",actuald);
Console.WriteLine("Data Converted");
Console.ReadKey();

Im HTML-Dokument muss ich den Inhalt zwischen <pre> </ pre> extrahieren. Der Inhalt meiner Datei sieht so aus

string actuald=null;
string data1 = File.ReadAllText("E://text.html");
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(data1);
HtmlNodeCollection col = doc.DocumentNode.SelectNodes("//pre");

foreach (HtmlNode node in col)
{
     actuald=node.Attributes[""].Value;
}
File.WriteAllText("E://text.csv",actuald);
Console.WriteLine("Data Converted");
Console.ReadKey();

aber im html doc habe ich keine klasse unter einem der html tags angegeben? Welchen Inhalt soll ich in den Attributen [""] geben?

Akzeptierte Antwort

So erhalten Sie Text in einem Knoten:

actuald = node.InnerText;

Um Text einschließlich der HTML-Tags zu erhalten

actuald = node.InnerText;



Lizenziert unter: CC-BY-SA with attribution
Nicht verbunden mit Stack Overflow
Ist diese KB legal? Ja, lerne warum
Lizenziert unter: CC-BY-SA with attribution
Nicht verbunden mit Stack Overflow
Ist diese KB legal? Ja, lerne warum