Rimuovi spazi bianchi e newline durante l'analisi con HtmlAgilityPack

asp.net c# html-agility-pack trim

Domanda

Ho provato ad analizzare HTML con HtmlAgilityPack nel modo seguente:

HtmlDocument htmlDoc = new HtmlDocument();
htmlDoc.LoadHtml(xhtmlString);

Sfortunatamente xhtmlString contiene spazi bianchi non necessari e caratteri di nuova riga, quindi il testo di htmlDoc ora appare così:

<html xmlns=\"http://www.w3.org/1999/xhtml\">\n\t<head></head>\n\t<body>\n\n<p>Alle Auktionen<br /></p>\n\n\t</body>\n</html>

Questo è un problema per me quando lavoro con gli elementi figli del corpo.

Qual è il modo più semplice per rimuovere questi personaggi non necessari?

HtmlAgilityPack offre qualche tipo di funzione per la pulizia di HTML da newline e schede?

Risposta popolare

Questa è l'indentazione del documento e non superflui spazi bianchi e caratteri di nuova riga.
Non vedo come questo potrebbe essere un problema, ma non puoi semplicemente sostituire i caratteri speciali come "\ t", "\ n"?

Facendo una ricerca veloce ho trovato questo Html Agility Pack: rendi il codice ordinato
Può essere utile impostare alcune proprietà su false



Related

Autorizzato sotto: CC-BY-SA with attribution
Non affiliato con Stack Overflow
È legale questo KB? Sì, impara il perché
Autorizzato sotto: CC-BY-SA with attribution
Non affiliato con Stack Overflow
È legale questo KB? Sì, impara il perché