使用HtmlAgilityPack在HTML中編碼

encoding html-agility-pack

我有一個關於中文編碼和保存回文件的問題。我目前正在使用HtmlAgilityPack解析HTML,用它做一些事情並將其保存回文件。我遇到了編碼問題,例如中文(GB2312(簡體))。當我打開文件時,我讀取編碼並使用HtmlAgilityPack將其保存回來

doc.Save(this._filePath, reader.CurrentEncoding);

但是中文字母完全殘缺了。關於如何保存回同一文件並保持當前編碼的任何想法?我也嘗試使用HtmlAgilityPack進行編碼,如下所示:

doc.Save(this._filePath, reader.CurrentEncoding);

但那也不起作用。有任何想法嗎?

一般承認的答案

因此,經過一些工作,我設法通過閱讀Meta標籤中的Declared編碼來使其工作。我雖然最初形成得很糟糕,但實際上它是正確的。 DeclaredEncoding確實從元標記中讀取了編碼。

當文件保存時,它仍然以ANSI格式保存,我似乎無法改變它。但是,元標記編碼確實在瀏覽器中呈現時確保文件處於檢查狀態。希望能幫助別人。




許可下: CC-BY-SA with attribution
不隸屬於 Stack Overflow
這個KB合法嗎? 是的,了解原因
許可下: CC-BY-SA with attribution
不隸屬於 Stack Overflow
這個KB合法嗎? 是的,了解原因