HTML Agility Pack Parsing Fehler?

c# html-agility-pack

Frage

Ich arbeite an ein paar hundert Seiten von Amazon Suchergebnissen für einige Datenanalyse, und mit hap, um die Ergebnisse zu analysieren:

hap.DocumentNode.SelectNodes("//ul[@id='s-results-list-atf']/li")

Dies gibt nur die ersten vier li der Ergebnisliste zurück, wenn es mehr gibt. Ich habe überprüft und doppelt überprüft und bin mir sicher, dass das richtig ist - mache ich etwas sehr falsch? Ich kann nicht sehen, warum die Ergebnisse auf nur 4 beschränkt sind. Typische Seiteninhalte könnten sein: https://www.amazon.com/s/?url=search-alias%3Daps&field-keywords=100+percent+barbarow

Die Verwendung anderer Suchergebnisseiten gibt das gleiche Problem und liefert nicht die Ergebnisse auf der Seite, sondern immer deutlich weniger als das, was da ist.

Akzeptierte Antwort

Probieren Sie es aus:

hap.DocumentNode.SelectNodes("//div[contains(@id,'tfResults')]//li[contains(@class,'s-result-item')]");

Keine Garantie für andere Seiten, da ich nur auf den angegebenen Link stütze



Related

Lizenziert unter: CC-BY-SA with attribution
Nicht verbunden mit Stack Overflow
Lizenziert unter: CC-BY-SA with attribution
Nicht verbunden mit Stack Overflow