Html Agility Packでテーブルを抽出する

html html-agility-pack vb.net web-scraping

質問

私はHTMLのアジリティパックを使用してWebページからテーブルを抽出しようとしています。これまで私はそれを少し進歩させてきました。これはこれまでの私のコードです

    Dim web As New HtmlAgilityPack.HtmlWeb()
    Dim htmlDoc As HtmlAgilityPack.HtmlDocument = web.Load("--Website url--")
    Dim html As String = htmlDoc.DocumentNode.OuterHtml

    Dim tabletag = htmlDoc.DocumentNode.SelectNodes("//table")

基本的には、次のhtmlタグを持つテーブルを見つける必要があります

    Dim web As New HtmlAgilityPack.HtmlWeb()
    Dim htmlDoc As HtmlAgilityPack.HtmlDocument = web.Load("--Website url--")
    Dim html As String = htmlDoc.DocumentNode.OuterHtml

    Dim tabletag = htmlDoc.DocumentNode.SelectNodes("//table")

どのように私は特定のテーブルにテーブルの検索を削除することができます任意のアイデア?

受け入れられた回答

ドキュメント内のすべてのテーブルの中で一意にするテーブルについて、それが何であるかを判断する必要があります。一意にするsummary属性など、表の属性の1つでもかまいません。または、それはあなたが探している必要があるテーブル内の子要素の1つかもしれません。あなたが指定しなかったので、私は結果をsummary属性に基づいて制限する方法の例を示します:

Dim tabletag = htmlDoc.DocumentNode.SelectNodes("//table[@summary='Contains search results']")



ライセンスを受けた: CC-BY-SA with attribution
所属していない Stack Overflow
このKBは合法ですか? はい、理由を学ぶ
ライセンスを受けた: CC-BY-SA with attribution
所属していない Stack Overflow
このKBは合法ですか? はい、理由を学ぶ