使用htmlagility pack修復缺少的HTML標記

html html-agility-pack

我的輸入包含

<table border="0" align="center" width="100%">
<tr><td class="header">A
<td class="header">B
<td class="header"><b>C</b>
</tr>
</table>

所需的輸出是

<table border="0" align="center" width="100%">
<tr><td class="header">A</td>
<td class="header">B</td>
<td class="header"><b>C</b></td>
</tr>
</table>

我嘗試了以下參考

如何使用HTMLAgilityPack修復html標籤(缺少<open>&<close>標籤)

我得到的輸出

<table border="0" align="center" width="100%">
<tr><td class="header"></td>A
<td class="header"></td>B
<td class="header"></td><b>C</b>
</tr>
</table>

我是這個HTML文件的新手......

提前致謝..

一般承認的答案

Html Agility Pack有一個特殊選項可用作HtmlDocument類的屬性,名為OptionFixNestedTags用於修復此類HTML錯誤:

    static void Main(string[] args)
    {
        HtmlDocument doc = new HtmlDocument();
        doc.OptionFixNestedTags = true;
        doc.Load(YourFile);

        doc.Save(Console.Out);
    }

這將輸出:

<table border="0" align="center" width="100%">
<tr><td class="header">A
</td><td class="header">B
</td><td class="header"><b>C</b>
</td></tr>
</table>



許可下: CC-BY-SA with attribution
不隸屬於 Stack Overflow
這個KB合法嗎? 是的,了解原因
許可下: CC-BY-SA with attribution
不隸屬於 Stack Overflow
這個KB合法嗎? 是的,了解原因