HtmlAgilityPackで不要なHTMLコンテンツのプレタグとコードタグを削除する方法

c# html-agility-pack

質問

私はこのベースのコードを作成しましたが、どのようにpreタグとcodeタグをすべて削除しましたか?

private static string RemoveHtmlTags(this string markup)
{
    if (string.IsNullOrEmpty(markup))
    {
        return string.Empty;
    }

    var document = new HtmlDocument();

    document.LoadHtml(markup);

    return document.DocumentNode.InnerText;
}

受け入れられた回答

HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(html);

doc.DocumentNode.Descendants()
                .Where(n => n.Name == "script" || n.Name == "style")
                .ToList()
                .ForEach(n => n.Remove());

人気のある回答

HtmlDocumentクラスを使用するとそうすることができます:

HtmlDocument doc = new HtmlDocument();

doc.LoadHtml(input);

doc.DocumentNode.SelectNodes("//style|//script").ToList().ForEach(n => n.Remove());



ライセンスを受けた: CC-BY-SA with attribution
所属していない Stack Overflow
このKBは合法ですか? はい、理由を学ぶ
ライセンスを受けた: CC-BY-SA with attribution
所属していない Stack Overflow
このKBは合法ですか? はい、理由を学ぶ