C# - 使用HTML Agility Pack獲取標籤內的文本

c# html-agility-pack

我使用以下代碼來解析HTML文檔並將其存儲為CSV文件。

string actuald=null;
string data1 = File.ReadAllText("E://text.html");
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(data1);
HtmlNodeCollection col = doc.DocumentNode.SelectNodes("//pre");

foreach (HtmlNode node in col)
{
     actuald=node.Attributes[""].Value;
}
File.WriteAllText("E://text.csv",actuald);
Console.WriteLine("Data Converted");
Console.ReadKey();

在html文檔中,我需要提取的內容位於<pre> </ pre>之間。我的文件的內容看起來像

string actuald=null;
string data1 = File.ReadAllText("E://text.html");
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(data1);
HtmlNodeCollection col = doc.DocumentNode.SelectNodes("//pre");

foreach (HtmlNode node in col)
{
     actuald=node.Attributes[""].Value;
}
File.WriteAllText("E://text.csv",actuald);
Console.WriteLine("Data Converted");
Console.ReadKey();

但是在html文檔中我沒有在任何html標籤下指定類?我應該在屬性[“”]中給出什麼內容?

一般承認的答案

要在節點內獲取文本:

actuald = node.InnerText;

獲取包含HTML標記的文本

actuald = node.InnerText;



許可下: CC-BY-SA with attribution
不隸屬於 Stack Overflow
這個KB合法嗎? 是的,了解原因
許可下: CC-BY-SA with attribution
不隸屬於 Stack Overflow
這個KB合法嗎? 是的,了解原因