Cómo elimino las etiquetas pre y código no deseadas del contenido html con HtmlAgilityPack

c# html-agility-pack

Pregunta

Creé este código basado en, pero cómo elimino todas las etiquetas pre y código.

private static string RemoveHtmlTags(this string markup)
{
    if (string.IsNullOrEmpty(markup))
    {
        return string.Empty;
    }

    var document = new HtmlDocument();

    document.LoadHtml(markup);

    return document.DocumentNode.InnerText;
}

Respuesta aceptada

HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(html);

doc.DocumentNode.Descendants()
                .Where(n => n.Name == "script" || n.Name == "style")
                .ToList()
                .ForEach(n => n.Remove());

Respuesta popular

Puedes hacerlo usando la clase HtmlDocument :

HtmlDocument doc = new HtmlDocument();

doc.LoadHtml(input);

doc.DocumentNode.SelectNodes("//style|//script").ToList().ForEach(n => n.Remove());



Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow
¿Es esto KB legal? Sí, aprende por qué
Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow
¿Es esto KB legal? Sí, aprende por qué