Carga del archivo HtmlAgilityPack

c# html-agility-pack

Pregunta

Tengo un problema cuando intento cargar un archivo desde el sistema de archivos. Emita que en el valor de algún control HTML tengo menos que el signo "<" dentro del valor del intervalo

HtmlDocument doc = new HtmlDocument();
doc.OptionReadEncoding = true;

//StreamReader str = new StreamReader(fileName, Encoding.UTF8);
StreamReader str = new StreamReader(@"E:\HTMLS\OEL\1030,1.html",Encoding.UTF8,true);

doc.Load(str.BaseStream, Encoding.ASCII);
//string streamString = str.ReadToEnd().
str.Close();
//all nodes

doc.DocumentNode.Descendants().Where(x => x.Name == "#text" && (x.InnerText == "\r\n\t" || x.InnerText == "\r\n" || x.InnerText == "\r\n\t\t")).ToList().ForEach(x => x.Remove());
List<HtmlNode> listHtmlNode = doc.DocumentNode.Descendants("table").ToList();

Respuesta popular

No debe tener símbolos como < como contenido en su HTML. Tenerlos en su html hace que el html no sea válido y hará que el paquete HTMLAgility no funcione correctamente.

Si los necesita en su html necesita codificarlos. < convierte en %lt; vea aquí http://www.w3schools.com/html/html_entities.asp




Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow
¿Es esto KB legal? Sí, aprende por qué
Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow
¿Es esto KB legal? Sí, aprende por qué