html agility packの解析エラー?

c# html-agility-pack

質問

私はいくつかのデータ分析のために数百ページのアマゾン検索結果に取り組んでおり、結果を解析するためにhapを使用しています:

hap.DocumentNode.SelectNodes("//ul[@id='s-results-list-atf']/li")

これは結果リストの最初の4つのliを返します。私はチェックしてダブルチェックして、これが正しいと確信しています - 私は何か非常に間違っている?なぜ結果がちょうど4に制限されるのかわかりません。典型的なページのコンテンツは次のようなものです: https : //www.amazon.com/s/?url=search-alias%3Daps&field-keywords=100+percent+barstow

他の検索結果ページを使用すると、同じ問題が発生し、結果はページに表示されませんが、常にそこにあるものよりも大幅に少なくなります。

受け入れられた回答

これを試してみてください:

hap.DocumentNode.SelectNodes("//div[contains(@id,'tfResults')]//li[contains(@class,'s-result-item')]");

私があなたが与えたリンクに基づいているだけなので、他のページの保証はありません




ライセンスを受けた: CC-BY-SA with attribution
所属していない Stack Overflow
このKBは合法ですか? はい、理由を学ぶ
ライセンスを受けた: CC-BY-SA with attribution
所属していない Stack Overflow
このKBは合法ですか? はい、理由を学ぶ