Entfernen Sie den HTML-Knoten von htmldocument: HTMLAgilityPack

c# collections dom html-agility-pack iteration

Frage

In meinem Code möchte ich das img-Tag entfernen, das keinen src-Wert hat. Ich verwende HTMLAgilitypacks HtmlDocument- Objekt. Ich finde den Img, der keinen src-Wert hat und versucht, ihn zu entfernen .. aber es gibt mir Fehler Collection wurde geändert; Aufzählungsoperation wird möglicherweise nicht ausgeführt. Kann mir jemand dafür helfen? Der Code, den ich benutzt habe, ist:

foreach (HtmlNode node in doc.DocumentNode.DescendantNodes())
{
    if (node.Name.ToLower() == "img")
    {                            
           string src = node.Attributes["src"].Value;
           if (string.IsNullOrEmpty(src))
           {
               node.ParentNode.RemoveChild(node, false);    
           }
   }
   else
   {
             ..........// i am performing other operations on document
   }
}

Akzeptierte Antwort

Was ich getan habe ist:

    List<string> xpaths = new List<string>();
    foreach (HtmlNode node in doc.DocumentNode.DescendantNodes())
    {
                        if (node.Name.ToLower() == "img")
                        {
                            string src = node.Attributes["src"].Value;
                            if (string.IsNullOrEmpty(src))
                            {
                                xpaths.Add(node.XPath);
                                continue;
                            }
                        }
    }

    foreach (string xpath in xpaths)
    {
            doc.DocumentNode.SelectSingleNode(xpath).Remove();
    }

Beliebte Antwort

Anscheinend HtmlNode.RemoveChild Sie die Auflistung während der Aufzählung mithilfe der HtmlNode.RemoveChild Methode.

Um dies zu beheben, müssen Sie Ihre Knoten in eine separate Liste / Array kopieren, indem Sie zB Enumerable.ToList<T>() oder Enumerable.ToArray<T>() .

var nodesToRemove = doc.DocumentNode
    .SelectNodes("//img[not(string-length(normalize-space(@src)))]")
    .ToList();

foreach (var node in nodesToRemove)
    node.Remove();

Wenn ich richtig liege, wird das Problem verschwinden.




Lizenziert unter: CC-BY-SA with attribution
Nicht verbunden mit Stack Overflow
Ist diese KB legal? Ja, lerne warum
Lizenziert unter: CC-BY-SA with attribution
Nicht verbunden mit Stack Overflow
Ist diese KB legal? Ja, lerne warum