Je dois analyser le HTML pour les images et remplacer ces balises par une nouvelle balise contenant uniquement le texte contenu dans la variable de remplacement. Quelqu'un peut-il montrer comment faire cela avec linq et l'utilisation standard?
J'ai utilisé un exemple linq maintenant pour remplacer les paragraphes. Mais, je reçois une erreur de lecture seule.
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(html);
IEnumerable<HtmlNode> paragraphs = doc.DocumentNode.DescendantNodes().Where(p => p.Name.ToLower() == "p");
foreach (HtmlNode p in paragraphs)
{
p.InnerText = "Hello World";
}
Aussi, y a-t-il un moyen facile de le transférer en texte? Ie sortie sous forme de chaîne
C'est ce que j'ai qui ne marche pas
MemoryStream outStream = new MemoryStream();
doc.Save(outStream);
outStream.Seek(0, SeekOrigin.Begin);
StreamReader reader = new StreamReader( outStream );
string text = reader.ReadToEnd();
var images = doc.DocumentNode.SelectNodes("//img");
if (images != null)
{
foreach (HtmlNode image in images)
{
var alt = image.GetAttributeValue("alt", "");
var nodeForReplace = HtmlTextNode.CreateNode(alt);
image.ParentNode.ReplaceChild(nodeForReplace, image);
}
}
var sb = new StringBuilder();
using (var writer = new StringWriter(sb))
{
doc.Save(writer);
}