HtmlAgilityPack scarica la pagina web caricata in modo asincrono da javascript

c# html-agility-pack javascript web-scraping

Domanda

sto usando HtmlAgilityPack e sto provando a caricare alcune pagine web. alcune pagine web sono basate su javascript e caricate in modo asincrono. c'è un modo per caricare la pagina web dopo x secondi o dopo essersi assicurati che la pagina sia completamente caricata

Risposta popolare

Html Agility Pack non imita le chiamate lato client per caricare dinamicamente il contenuto nel DOM. Si tratta di un raschiatore senza testa che sta scaricando la pagina statica fornita dal server; se si desidera tale contenuto, sarà necessario simulare le chiamate effettuate dal browser client. Se non vuoi provare ad emulare le chiamate che farebbe un browser, invece di usare un raschietto senza testa, puoi usare qualcosa come Selenium per fare questo per te, dal lato negativo, il browser verrà aperto sulla macchina host.




Autorizzato sotto: CC-BY-SA with attribution
Non affiliato con Stack Overflow
È legale questo KB? Sì, impara il perché
Autorizzato sotto: CC-BY-SA with attribution
Non affiliato con Stack Overflow
È legale questo KB? Sì, impara il perché