Supprimer les espaces et les nouvelles lignes lors de l'analyse avec HtmlAgilityPack

asp.net c# html-agility-pack trim

Question

J'ai essayé d'analyser HTML avec HtmlAgilityPack de la manière suivante:

HtmlDocument htmlDoc = new HtmlDocument();
htmlDoc.LoadHtml(xhtmlString);

Malheureusement, xhtmlString contient des espaces inutiles et des caractères de nouvelle ligne. Le _text de htmlDoc ressemble maintenant à ceci:

<html xmlns=\"http://www.w3.org/1999/xhtml\">\n\t<head></head>\n\t<body>\n\n<p>Alle Auktionen<br /></p>\n\n\t</body>\n</html>

C'est un problème pour moi lorsque je travaille avec les éléments enfants du corps.

Quel est le moyen le plus simple de supprimer ces caractères inutiles?

HtmlAgilityPack offre-t-il une sorte de fonction permettant de nettoyer HTML à partir de nouvelles lignes et d'onglets?

Réponse populaire

Il s'agit de l'indentation du document et non des espaces et des caractères de nouvelle ligne inutiles.
Je ne vois pas en quoi cela pourrait poser problème, mais vous ne pouvez pas simplement remplacer les caractères spéciaux tels que "\ t", "\ n"?

En faisant une recherche rapide, j'ai trouvé ce pack d'agilité HTML: donnez à votre code une apparence soignée
Peut-être peut-être utile de définir certaines propriétés sur false




Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow
Est-ce KB légal? Oui, apprenez pourquoi
Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow
Est-ce KB légal? Oui, apprenez pourquoi