Ошибка анализа синтаксического пакета html?

c# html-agility-pack

Вопрос

Я работаю над несколькими сотнями страниц результатов поиска amazon для некоторого анализа данных и используя hap для анализа результатов:

hap.DocumentNode.SelectNodes("//ul[@id='s-results-list-atf']/li")

Это возвращает только первые четыре листа списка результатов, хотя их больше. Я проверил и дважды проверил, и я уверен, что это правильно - я делаю что-то очень не так? Я не понимаю, почему результаты ограничены просто 4. Типичным содержанием страницы может быть: https://www.amazon.com/s/?url=search-alias%3Daps&field-keywords=100+percent+barstow

Использование других страниц результатов поиска дает ту же проблему и не дает результатов на странице, но всегда значительно меньше, чем там.

Принятый ответ

Попробуйте:

hap.DocumentNode.SelectNodes("//div[contains(@id,'tfResults')]//li[contains(@class,'s-result-item')]");

Никаких гарантий для других страниц, потому что я основываюсь только на ссылке, которую вы дали



Related

Лицензировано согласно: CC-BY-SA with attribution
Не связан с Stack Overflow
Лицензировано согласно: CC-BY-SA with attribution
Не связан с Stack Overflow