Codifica in HTML utilizzando HtmlAgilityPack

encoding html-agility-pack

Domanda

Ho una domanda sulla codifica cinese e sul salvataggio in un file. Attualmente sto usando HtmlAgilityPack per analizzare HTML, fare alcune cose con esso e salvarlo nuovamente nel file. Sto riscontrando un problema con la codifica, ad esempio il cinese (GB2312 (semplificato)). Quando apro il file, leggo la codifica e la salvi, usando HtmlAgilityPack

doc.Save(this._filePath, reader.CurrentEncoding);

ma le lettere cinesi vengono completamente mutilate. Qualche idea su come posso salvare lo stesso file e mantenere la codifica corrente? Ho anche provato a ottenere la codifica con HtmlAgilityPack come tale:

doc.Save(this._filePath, reader.CurrentEncoding);

ma non ha funzionato neanche. Qualche idea?

Risposta accettata

Quindi, dopo un po 'di lavoro, sono riuscito a farlo funzionare leggendo la codifica dichiarata dal tag Meta. Anche se inizialmente era mal strutturato, ma in realtà era corretto. DeclaredEncoding ha letto la codifica dal meta tag.

Quando il file è stato salvato, è ancora salvato in formato ANSI e non riesco a cambiarlo. Tuttavia, la codifica del meta tag sembra mantenere il file sotto controllo quando viene eseguito il rendering nel browser. Spero che aiuti qualcuno.




Autorizzato sotto: CC-BY-SA with attribution
Non affiliato con Stack Overflow
È legale questo KB? Sì, impara il perché
Autorizzato sotto: CC-BY-SA with attribution
Non affiliato con Stack Overflow
È legale questo KB? Sì, impara il perché