HTML DOM을 쉽게 관리 할 수있는 C # 개체가 있습니까?

c# dom dom-manipulation html-agility-pack

문제

HTTP 게시물에서 반환 된 페이지의 HTML이 포함 된 문자열이있는 경우 DOM을 쉽게 통과시킬 수있는 방법으로 어떻게 변환 할 수 있습니까?

HtmlDocument 객체가 의미가 있다고 생각했지만 생성자가 없습니다. HTML DOM을 쉽게 관리 할 수있는 유형이 있습니까?

감사,
매트

수락 된 답변

HtmlDocument는 WebBrowser 컨트롤에서 이미로드 한 문서의 인스턴스입니다. 따라서 아무 ctor.

html 민첩성 팩 은 지금까지 내가이 목적에 사용한 최고의 라이브러리입니다

코드 플렉스 위키의 예제

HtmlDocument doc = new HtmlDocument();
doc.Load("file.htm");
foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href]"))
{
    HtmlAttribute att = link["href"];
    att.Value = FixLink(att);
}
doc.Save("file.htm");

이 예제는 파일 로딩을 보여 주지만 문자열이나 스트림을로드 할 수있는 오버로드가 있습니다.




아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.
아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.