C # - Obtener el texto dentro de las etiquetas usando HTML Agility Pack

c# html-agility-pack

Pregunta

He utilizado el siguiente código para analizar el documento HTML y almacenarlo como un archivo CSV.

string actuald=null;
string data1 = File.ReadAllText("E://text.html");
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(data1);
HtmlNodeCollection col = doc.DocumentNode.SelectNodes("//pre");

foreach (HtmlNode node in col)
{
     actuald=node.Attributes[""].Value;
}
File.WriteAllText("E://text.csv",actuald);
Console.WriteLine("Data Converted");
Console.ReadKey();

en el documento html, el contenido que necesito extraer se encuentra entre <pre> </ pre>. el contenido de mi archivo parece

string actuald=null;
string data1 = File.ReadAllText("E://text.html");
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(data1);
HtmlNodeCollection col = doc.DocumentNode.SelectNodes("//pre");

foreach (HtmlNode node in col)
{
     actuald=node.Attributes[""].Value;
}
File.WriteAllText("E://text.csv",actuald);
Console.WriteLine("Data Converted");
Console.ReadKey();

pero en el documento html no tengo ninguna clase especificada en ninguna de las etiquetas html? ¿Qué contenido debo dar en los atributos [""]?

Respuesta aceptada

Para obtener texto dentro de un nodo:

actuald = node.InnerText;

Para obtener texto incluyendo las etiquetas HTML

actuald = node.InnerText;



Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow
¿Es esto KB legal? Sí, aprende por qué
Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow
¿Es esto KB legal? Sí, aprende por qué