HTML 민첩성 팩 사용 방법

c# html html-agility-pack

문제

HTML 민첩성 팩 은 어떻게 사용합니까?

내 XHTML 문서가 완전하지 않습니다. 그래서 그것을 사용하고 싶었습니다. 내 프로젝트에서 어떻게 사용합니까? 내 프로젝트는 C #입니다.

인기 답변

먼저 HTMLAgilityPack 너겟 패키지를 프로젝트에 설치하십시오.

그런 다음 예제로 :

HtmlAgilityPack.HtmlDocument htmlDoc = new HtmlAgilityPack.HtmlDocument();

// There are various options, set as needed
htmlDoc.OptionFixNestedTags=true;

// filePath is a path to a file containing the html
htmlDoc.Load(filePath);

// Use:  htmlDoc.LoadHtml(xmlString);  to load from a string (was htmlDoc.LoadXML(xmlString)

// ParseErrors is an ArrayList containing any errors from the Load statement
if (htmlDoc.ParseErrors != null && htmlDoc.ParseErrors.Count() > 0)
{
    // Handle any parse errors as required

}
else
{

    if (htmlDoc.DocumentNode != null)
    {
        HtmlAgilityPack.HtmlNode bodyNode = htmlDoc.DocumentNode.SelectSingleNode("//body");

        if (bodyNode != null)
        {
            // Do something with bodyNode
        }
    }
}

(주의 :이 코드는 단지 예일 뿐이며 반드시 최선의 방법은 아닙니다. 자신의 응용 프로그램에서 맹목적으로 사용하지 마십시오.)

HtmlDocument.Load() 메서드는 .NET Framework의 다른 스트림 지향 클래스와의 통합에 매우 유용한 스트림을 받아들입니다. HtmlEntity.DeEntitize() 가 html 엔티티를 올바르게 처리하는 데 유용한 또 다른 방법입니다. (Matthew에게 감사드립니다)

HtmlDocumentHtmlNode 는 가장 많이 사용할 클래스입니다. XML 구문 분석기와 마찬가지로 XPath 표현식을 허용하는 selectSingleNode 및 selectNodes 메서드를 제공합니다.

HtmlDocument.Option?????? 주의를 기울이십시오. 부울 속성 이 메소드는 LoadLoadXML 메서드가 HTML / XHTML을 처리하는 방법을 제어합니다.

HtmlAgilityPack.chm이라는 컴파일 된 도움말 파일이 있으며 각 개체에 대한 완전한 참조가 있습니다. 이것은 일반적으로 솔루션의 기본 폴더에 있습니다.




아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.
아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.