ottenere l'origine della pagina Web con l'html reso da javascript

asp.net c# html-agility-pack vb.net

Domanda

Se lo uso

WebClient client = new WebClient();
String htmlCode = client.DownloadString("http://test.net");

Sono in grado di usare il pacchetto agility per scansionare l'html e ottenere la maggior parte dei tag di cui ho bisogno ma manca l'html che viene reso dal javascript.

La mia domanda è, come ottengo il sorgente finale della pagina renderizzata usando c #. C'è qualcosa di più nel WebClient per ottenere l'ultima fonte di rendering dopo l'esecuzione di javascript?

Risposta popolare

L'HTML Agility Pack da solo non è abbastanza per fare ciò che vuoi, è necessario anche un motore javascript. Per fare ciò, potresti voler controllare qualcosa come Geckofx, che ti permetterà di incorporare un browser web pienamente funzionale nella tua applicazione, e che ti permetterà di accedere in modo programmatico ai contenuti della dom dopo che la pagina è stata renderizzata.

http://code.google.com/p/geckofx/




Autorizzato sotto: CC-BY-SA with attribution
Non affiliato con Stack Overflow
È legale questo KB? Sì, impara il perché
Autorizzato sotto: CC-BY-SA with attribution
Non affiliato con Stack Overflow
È legale questo KB? Sì, impara il perché