Strumento per scrivere XPATH automaticamente per il parser web?

html-agility-pack html-parsing xpath

Domanda

Attualmente ho bisogno di estrarre i dati dai siti web. Ho provato a utilizzare HTML Agility Pack, che utilizza XPATH per estrarre i dati. È disponibile uno strumento che automatizza la scrittura di XPATH in modo che anche un utente ingenuo possa utilizzare la configurazione dello strumento di analisi senza scrivere XPATH. Si prega di fornire i vostri preziosi suggerimenti per i miei scenari.

NOTA: alcuni strumenti sono disponibili per scrivere XPATH ma richiede un XML ben formato, ma nel mio caso ho documenti HTML malformati come input.

Risposta popolare

Sì, c'è un tale strumento !

Puoi certamente usare il metodo integrato presente in molti browser web (come suggerito da Mike). Tuttavia, ci sono anche plugin e utilità aggiuntivi.

Ho trovato che l' helper XPath per l' estensione di Chrome è il più utile. Ha lo stesso scopo, ma è facile da usare e crea espressioni XPath più robuste (basate su attributi come id) piuttosto che una semplice posizione. Puoi anche modificare l'espressione in linea e vedere i risultati in tempo reale.




Autorizzato sotto: CC-BY-SA with attribution
Non affiliato con Stack Overflow
È legale questo KB? Sì, impara il perché
Autorizzato sotto: CC-BY-SA with attribution
Non affiliato con Stack Overflow
È legale questo KB? Sì, impara il perché