Utilisez HtmlAgilityPack pour déterminer si la chaîne contient UNIQUEMENT des balises dans la liste des balises autorisées

c# html-agility-pack

Question

cf / Recherche de chaînes HTML dans un document et des questions similaires.

J'ai vu des exemples d'utilisation de HtmlAgilityPack pour analyser une chaîne à la recherche de balises spécifiques, mais que se passe-t-il si je veux m'assurer que la chaîne d'entrée ne contient que des chaînes d'une liste List<string> AllowedTags ?

En d'autres termes, comment puis-je effectuer une itération sur doc.DocumentNode.Descendants pour identifier le nom de la balise et vérifier s'il se trouve dans la liste?

Réponse acceptée

var allowedTags = new List<string> { "html", "head", "body", "div" };

bool containsOnlyAllowedTags =
         doc.DocumentNode
            .Descendants()
            .Where(n => n.NodeType == HtmlNodeType.Element)
            .All(n => allowedTags.Contains(n.Name));

Réponse populaire

List<string> AllowedTags = new List<string>() { "br", "a" };
HtmlDocument goodDoc = new HtmlDocument();
goodDoc.LoadHtml("<a href='asdf'>asdf</a><br /><a href='qwer'>qwer</a>");
bool containsBadTags = goodDoc.DocumentNode .Descendants()
                                            .Where(node => node.NodeType == HtmlNodeType.Element)
                                            .Select(node => node.Name)
                                            .Except(AllowedTags)
                                            .Any();
HtmlDocument badDoc = new HtmlDocument();
badDoc.LoadHtml("<a href='asdf'><b>asdf</b></a><br /><a href='qwer'>qwer</a>");
containsBadTags = badDoc.DocumentNode   .Descendants()
                                        .Where(node => node.NodeType == HtmlNodeType.Element)
                                        .Select(node => node.Name)
                                        .Except(AllowedTags)
                                        .Any();


Related

Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow
Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow