從htmldocument中刪除html節點:HTMLAgilityPack

c# collections dom html-agility-pack iteration

在我的代碼中,我想刪除沒有src值的img標記。我正在使用HTMLAgilitypack的HtmlDocument對象。我發現img沒有src值並試圖刪除它..但它給了我錯誤集合被修改;枚舉操作可能無法執行。任何人都可以幫助我嗎?我使用的代碼是:

foreach (HtmlNode node in doc.DocumentNode.DescendantNodes())
{
    if (node.Name.ToLower() == "img")
    {                            
           string src = node.Attributes["src"].Value;
           if (string.IsNullOrEmpty(src))
           {
               node.ParentNode.RemoveChild(node, false);    
           }
   }
   else
   {
             ..........// i am performing other operations on document
   }
}

一般承認的答案

我所做的是:

    List<string> xpaths = new List<string>();
    foreach (HtmlNode node in doc.DocumentNode.DescendantNodes())
    {
                        if (node.Name.ToLower() == "img")
                        {
                            string src = node.Attributes["src"].Value;
                            if (string.IsNullOrEmpty(src))
                            {
                                xpaths.Add(node.XPath);
                                continue;
                            }
                        }
    }

    foreach (string xpath in xpaths)
    {
            doc.DocumentNode.SelectSingleNode(xpath).Remove();
    }

熱門答案

您似乎是在枚舉期間使用HtmlNode.RemoveChild方法修改集合。

要解決此問題,您需要通過調用例如Enumerable.ToList<T>()Enumerable.ToArray<T>()將節點複製到單獨的列表/數組。

var nodesToRemove = doc.DocumentNode
    .SelectNodes("//img[not(string-length(normalize-space(@src)))]")
    .ToList();

foreach (var node in nodesToRemove)
    node.Remove();

如果我是對的,問題就會消失。




許可下: CC-BY-SA with attribution
不隸屬於 Stack Overflow
這個KB合法嗎? 是的,了解原因
許可下: CC-BY-SA with attribution
不隸屬於 Stack Overflow
這個KB合法嗎? 是的,了解原因