어느 것이 최고의 HTML 깔끔한 팩입니까? HTML 웹 페이지를 깔끔하게 만들 수있는 HTML 민첩성 팩의 옵션이 있습니까?

c# html-agility-pack html-parsing htmltidy winforms

문제

html 민첩성 팩 을 사용하여 html 표 정보 를 구문 분석 합니다 . 이제 결말 태그가 빠진 일부 html 콘텐츠가 있고 끝 페이지 누락으로 인해 그러한 페이지가 나타납니다. html 민첩성 팩은 정보를 올바르게 구문 분석하지 않습니다. 그래서 종료 태그없는 곳에 끝 태그를 삽입하여 html 민첩성 분석 정보를 올바르게 봅니다. 누락 된 결말 태그를 삽입하려면 어떻게해야합니까? 내 자신의 코드 를 작성하거나 html 정리 패키지 를 사용해야합니까?

html tidy pack이 가장 좋은 html 정리 팩인 경우, 가능한 경우이를 사용하는 방법은 무엇입니까? 그리고 만약 내 자신의 코드 가 될 수있는 것보다 수 있습니까?

html 민첩성 팩 에는 html 페이지를 깔끔하게 만들고 웹 페이지를 구문 분석 할 수 있는 옵션 이 있습니까?

수락 된 답변

HTML 민첩성 팩에서 나는 html 페이지를 tidy로 만드는 옵션을 찾지 못했습니다. 누락 된 닫는 태그를 삽입하는 옵션이 있지만 html 민첩성 팩의 일부 html 페이지에서만 작동합니다.

  HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
      doc.OptionFixNestedTags=true;

나는 또한 정규 표현식을 시도했지만 html 페이지에서만 작동한다.

그래서 최고의 HTML 깔끔한 팩을 발견 :

http://www.devx.com/dotnet/Article/20505/1763/page/2.

우리는 거기에 볼 수 있습니다 : dll을 가져 오는 방법과 그 깔끔한 팩을 사용하는 방법, 샘플 코드도 있습니다. 그것은 전부에 중대하다. 그것은 결여 꼬리표를 삽입 할 수 있고 당신의 html 페이지를 청결한 만든다 .

모두를 도와 주셔서 감사합니다 ..




아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.
아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.