Come rimuovere i nodi HTML vuoti con HtmlAgilityPack?

c# html-agility-pack

Domanda

Sto cercando di rimuovere i nodi HTML vuoti con HtmlAgilityPack. Voglio rimuovere tutti i nodi come questo:

<p><span>&nbsp;</span></p>

Ecco cosa sto cercando ma non funziona:

    static string RemoveEmptyParagraphs(string html)
    {
        HtmlDocument document = new HtmlAgilityPack.HtmlDocument();
        document.LoadHtml(html);
        foreach (HtmlNode eachNode in document.DocumentNode.SelectNodes("//p/span/text() = '&nbsp;'"))
            eachNode.Remove();
        html = document.DocumentNode.OuterHtml;
        return html;
    }

Risposta accettata

Prima di caricare l'html con document.LoadHtml(html); Puoi farlo:

document.LoadHtml(html.Replace("<p><span>&nbsp;</span></p>", ""));

Oppure dai un'occhiata a questo :

static void RemoveEmptyNodes(HtmlNode containerNode)
{
  if (containerNode.Attributes.Count == 0 && !_notToRemove.Contains(containerNode.Name) && (containerNode.InnerText == null || containerNode.InnerText == string.Empty) )
  {
    containerNode.Remove();
  }
  else
  {
    for (int i = containerNode.ChildNodes.Count - 1; i >= 0; i-- )
    {
        RemoveEmptyNodes(containerNode.ChildNodes[i]);
    }
  }
}


Related

Autorizzato sotto: CC-BY-SA with attribution
Non affiliato con Stack Overflow
È legale questo KB? Sì, impara il perché
Autorizzato sotto: CC-BY-SA with attribution
Non affiliato con Stack Overflow
È legale questo KB? Sì, impara il perché