html agility pack erreur d’analyse?

c# html-agility-pack

Question

Je travaille sur quelques centaines de pages de résultats de recherche amazon pour l'analyse de données et j'utilise heureusement pour analyser les résultats:

hap.DocumentNode.SelectNodes("//ul[@id='s-results-list-atf']/li")

Cela ne retourne que les quatre premiers li de la liste des résultats, même s’il y en a plus. J'ai vérifié et vérifié deux fois et je suis sûr que c'est vrai - est-ce que je fais quelque chose de très faux? Je ne vois pas pourquoi les résultats sont limités à 4. Le contenu d'une page peut être typique: https://www.amazon.com/s/?url=search-alias%3Daps&field-keywords=100+percent+barstow

L'utilisation d'autres pages de résultats de recherche pose le même problème et ne donne pas les résultats sur la page, mais toujours beaucoup moins que ce qui y est.

Réponse acceptée

Essayez ceci:

hap.DocumentNode.SelectNodes("//div[contains(@id,'tfResults')]//li[contains(@class,'s-result-item')]");

Aucune garantie pour les autres pages car je ne me base que sur le lien que vous avez donné




Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow
Est-ce KB légal? Oui, apprenez pourquoi
Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow
Est-ce KB légal? Oui, apprenez pourquoi