Quel est le meilleur pack de rangement HTML? Existe-t-il une option dans le pack d'agilité HTML pour rendre la page Web HTML ordonnée?

c# html-agility-pack html-parsing htmltidy winforms

Question

J'utilise html agility pack pour analyser les informations tabulaires html. Maintenant , il y a un contenu HTML sans balise de fin et de cette page en raison de manquer les étiquettes de fin pack agilité html ne pas analyser les informations properly.So Je veux insérer la fin des balises où il y a des variables manquantes, se terminant ainsi le paquet d'agilité html analyser les informations correctement. Donc, pour insérer les balises de fin manquantes, que dois-je faire? Devrais-je écrire mon propre code pour cela ou utiliser html tidy pack pour le faire?

Si html Tidy Pack, quel est le meilleur html Tidy Pack et comment l'utiliser, le cas échéant? Et si mon propre code que ce à quoi il peut ressembler?

Existe-t-il une option dans le pack d'agilité HTML qui puisse nous permettre de commencer par ranger la page html, puis d' analyser la page Web.

Réponse acceptée

Dans le pack d'agilité HTML, je n'ai trouvé aucune option qui rende la page HTML ordonnée.

  HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
      doc.OptionFixNestedTags=true;

J'ai aussi essayé regex pour ça, mais ça marche aussi pour certaines pages html seulement.

J'ai donc trouvé le meilleur pack de rangement html :

http://www.devx.com/dotnet/Article/20505/1763/page/2.

Nous pouvons voir ici: comment importer la dll et comment utiliser ce paquet ordonné, un exemple de code est également disponible. Il est génial. Il peut insérer les balises de fermeture manquantes et ranger votre page html.

Merci d'avoir aidé tout le monde ..



Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow
Est-ce KB légal? Oui, apprenez pourquoi
Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow
Est-ce KB légal? Oui, apprenez pourquoi