HTML 민첩 팩을 사용하여 태그 안의 텍스트 가져 오기

c# html-agility-pack

문제

다음 코드를 사용하여 HTML 문서를 구문 분석하고 CSV 파일로 저장합니다.

string actuald=null;
string data1 = File.ReadAllText("E://text.html");
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(data1);
HtmlNodeCollection col = doc.DocumentNode.SelectNodes("//pre");

foreach (HtmlNode node in col)
{
     actuald=node.Attributes[""].Value;
}
File.WriteAllText("E://text.csv",actuald);
Console.WriteLine("Data Converted");
Console.ReadKey();

html 문서에서 추출해야하는 내용은 <pre> </ pre> 사이에 있습니다. 내 파일의 내용은 다음과 같습니다.

string actuald=null;
string data1 = File.ReadAllText("E://text.html");
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(data1);
HtmlNodeCollection col = doc.DocumentNode.SelectNodes("//pre");

foreach (HtmlNode node in col)
{
     actuald=node.Attributes[""].Value;
}
File.WriteAllText("E://text.csv",actuald);
Console.WriteLine("Data Converted");
Console.ReadKey();

하지만 html 문서에서 나는 html 태그 중 하나에서 지정된 클래스가 없다? 속성 [ ""]에 어떤 내용을 제공해야합니까?

수락 된 답변

노드 내부에서 텍스트를 가져 오려면 :

actuald = node.InnerText;

HTML 태그를 포함한 텍스트를 가져 오려면

actuald = node.InnerText;



아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.
아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.