Html Agility Pack을 사용하여 테이블 추출하기

html html-agility-pack vb.net web-scraping

문제

HTML 애자일 팩을 사용하여 웹 페이지에서 표를 추출하려고합니다. 지금까지 나는 그것으로 조금의 진전을 할 수 있었다. 지금까지 내 코드입니다.

    Dim web As New HtmlAgilityPack.HtmlWeb()
    Dim htmlDoc As HtmlAgilityPack.HtmlDocument = web.Load("--Website url--")
    Dim html As String = htmlDoc.DocumentNode.OuterHtml

    Dim tabletag = htmlDoc.DocumentNode.SelectNodes("//table")

기본적으로 다음 html 태그가있는 표를 찾아야합니다.

    Dim web As New HtmlAgilityPack.HtmlWeb()
    Dim htmlDoc As HtmlAgilityPack.HtmlDocument = web.Load("--Website url--")
    Dim html As String = htmlDoc.DocumentNode.OuterHtml

    Dim tabletag = htmlDoc.DocumentNode.SelectNodes("//table")

어떤 아이디어 어떻게 테이블에 대한 검색을 특정 테이블로 스트립 할 수 있습니까?

수락 된 답변

문서의 모든 테이블 중에서 고유 한 테이블을 결정해야합니다. 고유하게 만드는 summary 속성과 같이 테이블의 속성 중 하나 일 수 있습니다. 또는, 필요한 표의 자식 요소 중 하나 일 수 있습니다. 사용자가 지정하지 않았으므로 summary 속성을 기반으로 결과를 제한하는 방법의 예를 보여줍니다.

Dim tabletag = htmlDoc.DocumentNode.SelectNodes("//table[@summary='Contains search results']")



아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.
아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.