Ich benutze derzeit den folgenden Code, der den InnerText extrahiert, aber was passiert, ist, ich bin mit einer Reihe von Kommentaren Zeilen von html <--
wie entferne ich diese mit dem unten stehenden Code?
HtmlWeb hwObject = new HtmlWeb();
HtmlAgilityPack.HtmlDocument htmldocObject = hwObject.Load(htmlURL);
foreach (var script in htmldocObject.DocumentNode.Descendants("script").ToArray())
script.Remove();
HtmlNode body = htmldocObject.DocumentNode.SelectSingleNode("//body");
resultingHTML = body.InnerText.ToString();
Filtern Sie die Knoten einfach nach Kommentarknoten und rufen Sie remove auf ihnen auf.
var rootNode = doc.DocumentNode;
var query = rootNode.Descendants().OfType<HtmlCommentNode>().ToList();
foreach (var comment in query)
{
comment.Remove();
}