Correction des balises HTML manquantes à l'aide du pack htmlagility

html html-agility-pack

Question

mon entrée contient

<table border="0" align="center" width="100%">
<tr><td class="header">A
<td class="header">B
<td class="header"><b>C</b>
</tr>
</table>

la sortie requise est

<table border="0" align="center" width="100%">
<tr><td class="header">A
<td class="header">B
<td class="header"><b>C</b>
</tr>
</table>

J'ai essayé la référence suivante

Comment réparer les balises HTML (avec les balises <open> et <close> manquantes) avec HTMLAgilityPack

la sortie je suis

<table border="0" align="center" width="100%">
<tr><td class="header">A
<td class="header">B
<td class="header"><b>C</b>
</tr>
</table>

Je suis nouveau dans ce fichier HTML ...

Merci d'avance..

Réponse acceptée

Le pack d'agilité HTML comporte une option spéciale disponible en tant que propriété sur la classe HtmlDocument , nommée OptionFixNestedTags pour la correction de ce type d'erreur HTML:

    static void Main(string[] args)
    {
        HtmlDocument doc = new HtmlDocument();
        doc.OptionFixNestedTags = true;
        doc.Load(YourFile);

        doc.Save(Console.Out);
    }

Cela produira:

    static void Main(string[] args)
    {
        HtmlDocument doc = new HtmlDocument();
        doc.OptionFixNestedTags = true;
        doc.Load(YourFile);

        doc.Save(Console.Out);
    }



Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow
Est-ce KB légal? Oui, apprenez pourquoi
Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow
Est-ce KB légal? Oui, apprenez pourquoi