htmldocument에서 html 노드를 제거하십시오 : HTMLAgilityPack

c# collections dom html-agility-pack iteration

문제

내 코드에서 src 값이없는 img 태그를 제거하고 싶습니다. HTMLAgilitypack의 HtmlDocument 객체를 사용하고 있습니다. src 값이없고 제거하려고하는 img를 찾고 있습니다. 그러나 오류가 발생합니다. Collection was modified; 열거 연산이 실행되지 않을 수 있습니다. 누구든지이 일을 도울 수 있습니까? 내가 사용한 코드는 다음과 같습니다.

foreach (HtmlNode node in doc.DocumentNode.DescendantNodes())
{
    if (node.Name.ToLower() == "img")
    {                            
           string src = node.Attributes["src"].Value;
           if (string.IsNullOrEmpty(src))
           {
               node.ParentNode.RemoveChild(node, false);    
           }
   }
   else
   {
             ..........// i am performing other operations on document
   }
}

수락 된 답변

내가 한 것은 :

    List<string> xpaths = new List<string>();
    foreach (HtmlNode node in doc.DocumentNode.DescendantNodes())
    {
                        if (node.Name.ToLower() == "img")
                        {
                            string src = node.Attributes["src"].Value;
                            if (string.IsNullOrEmpty(src))
                            {
                                xpaths.Add(node.XPath);
                                continue;
                            }
                        }
    }

    foreach (string xpath in xpaths)
    {
            doc.DocumentNode.SelectSingleNode(xpath).Remove();
    }

인기 답변

열거 형 중 HtmlNode.RemoveChild 메서드를 사용하여 컬렉션을 수정하는 것 같습니다.

이 문제를 해결하려면 Enumerable.ToList<T>() 또는 Enumerable.ToArray<T>() 를 호출하여 노드를 별도의 목록 / 배열로 복사해야합니다.

var nodesToRemove = doc.DocumentNode
    .SelectNodes("//img[not(string-length(normalize-space(@src)))]")
    .ToList();

foreach (var node in nodesToRemove)
    node.Remove();

내가 옳다면 문제는 사라질 것입니다.




아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.
아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.