html 민첩성 분석 오류를 팩?

c# html-agility-pack

문제

몇 가지 데이터 분석을 위해 아마존 검색 결과 몇 백 페이지를 작업 중이며 결과를 구문 분석하기 위해 hap을 사용하고 있습니다.

hap.DocumentNode.SelectNodes("//ul[@id='s-results-list-atf']/li")

이것은 더 많은 것이있을 때만 결과 목록의 처음 네 개를 반환합니다. 나는 체크하고 체크를 두 번했다. 나는 이것이 옳다는 것을 확신한다. 나는 아주 잘못된 것을하고 있는가? 결과가 단지 4 개로 제한되는 이유를 알 수 없습니다. 일반적인 페이지 콘텐츠는 다음과 같습니다. https://www.amazon.com/s/?url=search-alias%3Daps&field-keywords=100+percent+barstow

다른 검색 결과 페이지를 사용하면 동일한 문제가 발생하고 결과는 페이지에 표시되지 않지만 항상 그 결과보다 훨씬 적습니다.

수락 된 답변

이것을 시도하십시오 :

hap.DocumentNode.SelectNodes("//div[contains(@id,'tfResults')]//li[contains(@class,'s-result-item')]");

내가 당신이 준 링크를 기반으로하기 때문에 다른 페이지에 대한 보장은 없습니다.



Related

아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow