Извлечение таблицы с помощью пакета html Agility Pack

html html-agility-pack vb.net web-scraping

Вопрос

Я пытаюсь извлечь таблицу с веб-страницы с помощью Html Agility Pack. До сих пор мне удалось немного продвинуться в этом. Это мой код до сих пор

    Dim web As New HtmlAgilityPack.HtmlWeb()
    Dim htmlDoc As HtmlAgilityPack.HtmlDocument = web.Load("--Website url--")
    Dim html As String = htmlDoc.DocumentNode.OuterHtml

    Dim tabletag = htmlDoc.DocumentNode.SelectNodes("//table")

В принципе мне нужно найти таблицу со следующим тегом html

     <table width="100%"  border="0" cellspacing="0" cellpadding="3" summary="Contains search results">

Любая идея, как я могу разбить мой поиск таблиц на эту конкретную таблицу?

Принятый ответ

Вы должны определить, что это касается таблицы, которая делает ее уникальной среди всех таблиц в документе. Это может быть один из этих атрибутов таблицы, например атрибут summary который делает его уникальным. Или это может быть один из его дочерних элементов внутри таблицы, который вам нужно искать. Поскольку вы не указали, я покажу пример того, как ограничить результаты на основе атрибута summary :

Dim tabletag = htmlDoc.DocumentNode.SelectNodes("//table[@summary='Contains search results']")


Related

Лицензировано согласно: CC-BY-SA with attribution
Не связан с Stack Overflow
Лицензировано согласно: CC-BY-SA with attribution
Не связан с Stack Overflow