Html 민첩성 팩에서 ParseErrors를 처리하는 방법

c# html html-agility-pack

문제

따라서 HTML 문서의 머리글과 바닥 글 섹션을 수집하여 기존 웹 페이지에 삽입하는 응용 프로그램이 있습니다. 두 섹션은 이미 div 태그로 싸여 있으므로 상자 내의 내용에는 html / body 태그가 없어야합니다.

즉, 닫히지 않은 태그를 확인하고이를 프로그래밍 방식으로 닫고 싶습니다. 나는 HTML 민첩성 팩에 매우 익숙하며 원하는 것을 성취 할 수있는 방법을 모르겠습니다. 다음은 Google 검색을 기반으로 추측 할 수있는 코드입니다.

    private bool RepairHtml(string htmlText)
    {
        var htmlDoc = new HtmlDocument();
        htmlDoc.OptionFixNestedTags = true;
        htmlDoc.LoadHtml(htmlText);
        var parseErrors = htmlDoc.ParseErrors;

        if (parseErrors != null)
        {
           foreach (var htmlParseError in parseErrors)
           {
              switch (htmlParseError.Code)
              {
                 case: HtmlParseErrorCode.TagNotClosed:
                    // Not sure what to do here
                    break;
              }
           }
        }
     }

오류가 발생한 태그를 선택하여 닫으려면 어떻게해야합니까?

도와 주셔서 미리 감사드립니다.

수락 된 답변

document.OptionFixNestedTags = true; 사용할 수 있습니다 document.OptionFixNestedTags = true; 자동으로 수정합니다.

배열 오류 목록을 보려면 여기클릭하십시오 .

htmlParseError.Line을 사용하면 오류의 원인을 확인할 수 있습니다. 희망은 도움이됩니다.



아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.
아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.