使用HtmlAgilityPack從解析的HTML中刪除所有類和ID

c# html html-agility-pack

我使用HtmlAgilityPack解析一些html頁面,我從這個頁面中提取html標籤,如下所示:

HtmlNode bodyContent = document.DocumentNode.SelectSingleNode("//body");
var all_text = bodyContent.SelectNodes("//div | //ul | //p | //table");

在返回的html中,每個標記都包含類和id,我想刪除所有id-s和所有類,我怎麼能這樣做?

一般承認的答案

也許你應該檢查這個鏈接: 鏈接

盡我所能,告訴你何時擁有HtmlNode,你可以使用它的屬性Attributes。此集合具有方法Remove(string),該方法接收要刪除的屬性的名稱。好吧,我在一個小項目中使用它。我不確定這對你有幫助。

所以基本上:

HtmlNode bodyContent = document.DocumentNode.SelectSingleNode("//body");
var all_text = bodyContent.SelectNodes("//div | //ul | //p | //table");

foreach(var node in all_text)
{
   node.Attributes.Remove("class");
   node.Attributes.Remove("id");
} 



許可下: CC-BY-SA with attribution
不隸屬於 Stack Overflow
這個KB合法嗎? 是的,了解原因
許可下: CC-BY-SA with attribution
不隸屬於 Stack Overflow
這個KB合法嗎? 是的,了解原因