Attualmente ho bisogno di estrarre i dati dai siti web. Ho provato a utilizzare HTML Agility Pack, che utilizza XPATH per estrarre i dati. È disponibile uno strumento che automatizza la scrittura di XPATH in modo che anche un utente ingenuo possa utilizzare la configurazione dello strumento di analisi senza scrivere XPATH. Si prega di fornire i vostri preziosi suggerimenti per i miei scenari.
NOTA: alcuni strumenti sono disponibili per scrivere XPATH ma richiede un XML ben formato, ma nel mio caso ho documenti HTML malformati come input.
Sì, c'è un tale strumento !
Puoi certamente usare il metodo integrato presente in molti browser web (come suggerito da Mike). Tuttavia, ci sono anche plugin e utilità aggiuntivi.
Ho trovato che l' helper XPath per l' estensione di Chrome è il più utile. Ha lo stesso scopo, ma è facile da usare e crea espressioni XPath più robuste (basate su attributi come id) piuttosto che una semplice posizione. Puoi anche modificare l'espressione in linea e vedere i risultati in tempo reale.