VB.net HTML AgilityPack을 사용하여 링크 및 테이블 구문 분석

.net html-agility-pack vb.net

문제

스크린 스크 래핑을 시도하고 HTML AgilityPack을 발견했지만 VB.net에서 사용하는 방법을 알아 내는데 어려움을 겪고 있습니다.

내가하고 싶은 첫 번째 작업은 HREF로 묶인 텍스트를 알고있는 경우 HREF 태그의 URL 문자열을 찾는 것입니다.

두 번째로해야 할 일은 HTML 테이블을 구문 분석하고 각 행을 거치며 데이터를 추출하여 데이터베이스에 저장할 수 있도록하는 것입니다 (기본 분석 후).

수락 된 답변

다음은 SO에 대한 좋은 시작 링크입니다. HTML Agility pack 사용 방법

링크 변경을위한 HtmlAgilityPack 예제가 작동하지 않습니다. 어떻게해야합니까?

그리고 이것 : HTML 문서의 모든 HREF URL 찾기 (잘못된 형식의 HTML 포함)

특정 HREF를 찾으려면 xpath 구문이 "// a [@ href = 'your url']", 즉 다음과 같이됩니다. "HREF 속성이 'url'과 동일한 태그를 가져옵니다.

편집하다:

예를 들어 html 텍스트 ' <a href="homepage.html">Cars</a> '가 있고 homepage.html을 찾은 경우와 같이 텍스트 만 알면 HREF를 찾으려면 다음과 같이하십시오. 그것.

        string s = @"<a href=""homepage.html"">Cars</a>";

        HtmlDocument doc = new HtmlDocument();
        doc.LoadHtml(s);

        HtmlNode node = doc.DocumentNode.SelectSingleNode("//a[text()='Cars']");
        Console.WriteLine("href=" + node.GetAttributeValue("href", null));


아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.
아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.