HTMLagilitypack이 모든 html 태그를 제거하지 않습니다 어떻게이 문제를 효율적으로 해결할 수 있습니까?

c# html-agility-pack string

문제

문자열에서 모든 html을 제거하려면 다음 방법을 사용하고 있습니다.

public static string StripHtmlTags(string html)
        {
            if (String.IsNullOrEmpty(html)) return "";
            HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
            doc.LoadHtml(html);
            return doc.DocumentNode.InnerText;
        }

그러나 다음 태그를 무시하는 것 같습니다 : […]

따라서 문자열은 기본적으로 다음과 같이 반환됩니다.

public static string StripHtmlTags(string html)
        {
            if (String.IsNullOrEmpty(html)) return "";
            HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
            doc.LoadHtml(html);
            return doc.DocumentNode.InnerText;
        }

이러한 종류의 태그가 제거되었는지 어떻게 확인할 수 있습니까?

모든 종류의 도움을 주시면 감사하겠습니다.

수락 된 답변

HttpUtility.HtmlDecode 사용해보기

public static string StripHtmlTags(string html)
{
    if (String.IsNullOrEmpty(html)) return "";
    HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
    doc.LoadHtml(html);
    return HttpUtility.HtmlDecode(doc.DocumentNode.InnerText);
}

HtmlDecode는 […][…] 로 변환합니다 […]




아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.
아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.