C # - Ottieni il testo all'interno dei tag usando HTML Agility Pack

c# html-agility-pack

Domanda

Ho usato il seguente codice per analizzare il documento HTML e memorizzarlo come file CSV.

string actuald=null;
string data1 = File.ReadAllText("E://text.html");
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(data1);
HtmlNodeCollection col = doc.DocumentNode.SelectNodes("//pre");

foreach (HtmlNode node in col)
{
     actuald=node.Attributes[""].Value;
}
File.WriteAllText("E://text.csv",actuald);
Console.WriteLine("Data Converted");
Console.ReadKey();

nel documento html, il contenuto che ho bisogno di estrarre si trova tra <pre> </ pre>. il contenuto del mio file è simile

string actuald=null;
string data1 = File.ReadAllText("E://text.html");
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(data1);
HtmlNodeCollection col = doc.DocumentNode.SelectNodes("//pre");

foreach (HtmlNode node in col)
{
     actuald=node.Attributes[""].Value;
}
File.WriteAllText("E://text.csv",actuald);
Console.WriteLine("Data Converted");
Console.ReadKey();

ma nel documento html non ho una classe specificata in nessuno dei tag html? Quale contenuto dovrei dare negli attributi [""]?

Risposta accettata

Per ottenere del testo all'interno di un nodo:

actuald = node.InnerText;

Per ottenere del testo compresi i tag HTML

actuald = node.InnerText;



Autorizzato sotto: CC-BY-SA with attribution
Non affiliato con Stack Overflow
È legale questo KB? Sì, impara il perché
Autorizzato sotto: CC-BY-SA with attribution
Non affiliato con Stack Overflow
È legale questo KB? Sì, impara il perché