Encodage en HTML en utilisant HtmlAgilityPack

encoding html-agility-pack

Question

J'ai une question à propos de l'encodage chinois et de la sauvegarde dans un fichier. J'utilise actuellement HtmlAgilityPack pour analyser le code HTML, y faire des choses et le sauvegarder dans le fichier. Je rencontre un problème d’encodage, tel que le chinois (GB2312 (simplifié)). Lorsque j'ouvre le fichier, je lis l'encodage et je le sauvegarde en utilisant HtmlAgilityPack.

doc.Save(this._filePath, reader.CurrentEncoding);

mais les lettres chinoises sont complètement mutilées. Des idées sur la façon dont je peux sauvegarder dans le même fichier et conserver le codage actuel? J'ai aussi essayé d'obtenir l'encodage avec le HtmlAgilityPack comme ceci:

doc.Save(this._filePath, reader.CurrentEncoding);

mais cela n'a pas fonctionné non plus. Des idées?

Réponse acceptée

Ainsi, après quelques travaux, j'ai réussi à le faire fonctionner en lisant le codage Déclaré de la balise Meta. Je pensais que c'était mal formé au départ, mais en réalité, c'était correct. Le DeclaredEncoding a lu le codage à partir de la balise META.

Lorsque le fichier est enregistré, il est toujours enregistré au format ANSI et je ne peux apparemment pas changer cela. Cependant, l'encodage des balises méta semble garder le fichier sous contrôle lors de son rendu dans le navigateur. J'espère que ça aide quelqu'un.




Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow
Est-ce KB légal? Oui, apprenez pourquoi
Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow
Est-ce KB légal? Oui, apprenez pourquoi