Caricare tabelle ed elenchi di dati, testi e database in modo ordinato
Aggiornato il:
Programmi gratuiti per gestire lunghi elenchi e dati aggregati per ordinarli
Quando si lavora col computer, in alcuni casi, capita di avere a che fare con grandi quantità di dati che bisogna rendere più leggibili possibile. Questi elenchi possono essere importati da un database esterno ma possono anche essere copiati da una pagina web. Per fare un esempio, quando si vuol portare sul computer il resoconto dei movimenti bancari dell'ultimo anno, scaricandolo o copiandolo dalle pagine web della propria banca online, si ottiene, generalmente, un file csv o un file di testo, spesso mal formattato e difficile da leggere o stampare. Un altro esempio potrebbe essere la lista di musiche che si hanno sul computer oppure una rubrica telefonica. In ambito aziendale ci si può trovare invece con grandi quantità di dati da sintetizzare e rendere più leggibili per una rapida consultazione.
Tutte queste attività di manipolazione dei dati aggregati, si può fare sicuramente con Excel ma, molto più semplicemente, si possono usare alcuni programmi gratuiti davvero innovativi e produttivi.
Il programma più nuovo è Open Refine, un programma open source di Google che permette di leggere anche una serie enorme di dati disordinati e metterli a posto, in modo che siano uniformi e possano essere copiati ed analizzati statisticamente. Prima di usare Open Refine conviene guardare i tre video pubblicati nella pagina di download per capirne le funzioni principali che riassumo sinteticamente. Refine può essere scaricato gratis e installato su pc Windows, Linux o Mac.
Quando, per esempio, si fa un copia e incolla di dati in una tabella da un elenco di una pagina web, essi possono essere incollati in un foglio Excel o in un file di testo e, si potrà verificare che essi sono quasi illegibili e bisogna rimetterli a posto. Anche nei casi in cui fosse disponibile un link per il download del file csv, ci sarebbero comunque problemi a gestire i dati incolonnati, soprattutto per modificarli in maniera coerente. Ecco allora che si può usare Open Refine, che permette di importare questo foglio di dati e di manipolarlo in maniera facile e veloce creando una tabella da dati grezzi e copiati.
Come si può vedere nei video, si può usare la funzione "Text Facet" per vedere la sintesi dei dati di una colonna e poterli gestire in maniera aggregata, unificando quindi quelli scritti male e cancellando quelli invalidi. La funzione Trim permette di rinominare gruppi di record tutti assieme.
Si possono poi creare espressioni regolari per rinominare i dati in modo uniforme, con regole precise. Con Cluster si possono unificare interi gruppi di dati, sintetizzandoli con due click. Per i valori numerici si possono fare operazioni di somma, media e creare grafici. Tutte queste operazioni su tabelle ed elenchi che, solitamente, si fanno con Excel, si possono gestire con Open Refine in modo decisamente più veloce e facile.
Quello che mi ha spinto a dedicare un articolo a questo strumento tecnico e quello che vorrei far capire è che non si tratta di un programma destinato soltanto alle aziende o a chi lavora con enormi database. Refine infatti può essere utilizzato per mettere in ordine, rapidamente, qualsiasi lista che proviene dal copia e incolla da una pagina web e per creare tabelle copiando elenchi da qualsiasi fonte. Ad esempio, si potrebbe andare su Wikipedia, copiare la lista di attori americani e metterli in una tabella velocemente con lo strumento di trasformazione dati. A livelli avanzati poi si possono creare tannte espressioni programmabili per estrarre dati da applicazioni web come Google Maps o altre.
Open Refine è un programma che non sostituisce Excel ma consente di gestire dati e tabelle che provengono da altre fonti.
Un altro programma gratuito per Windows, Mac e Linux è CleanHaven che serve a copiare e creare tabelle oltre che a ripulire liste, dati e testi. Non solo si può convertire il testo trasformando le maiuscole in minuscole o cancellando i caratteri non stampabili ma si possono anche, ad esempio, aggregare linee separate da ritorni a capo, filtrare parole, fondere colonne di una tabella, ricerca e sostituzione di testo, rimozioni di spazi vuoti e correzione della punteggiatura. Anche CleanHaven ha una bella interfaccia pulita con menu facili da capire e da usare. CleanHaven supporta la visualizzazione tabellare, per cui si può incollare qualsiasi testo o elenco da Excel, da un file CSV, o qualsiasi altra sorgente e visualizzare questi in CleanHaven. La prima riga può diventare automaticamente l'intestazione di colonna ed i dati si possono ordinare facilmente con un click.
Sia Refine che CleanHaven possono gestire un gran numero di tabelle e diventano due programmi utili a tutti per operazioni base di copia e incolla di tabelle da internet e indispensabili per chi lavora con fogli Excel, per chi fa contabilità, per chi fa analisi dei costi, magazzino, archiviazione, segreteria e project management.
Tutte queste attività di manipolazione dei dati aggregati, si può fare sicuramente con Excel ma, molto più semplicemente, si possono usare alcuni programmi gratuiti davvero innovativi e produttivi.
Il programma più nuovo è Open Refine, un programma open source di Google che permette di leggere anche una serie enorme di dati disordinati e metterli a posto, in modo che siano uniformi e possano essere copiati ed analizzati statisticamente. Prima di usare Open Refine conviene guardare i tre video pubblicati nella pagina di download per capirne le funzioni principali che riassumo sinteticamente. Refine può essere scaricato gratis e installato su pc Windows, Linux o Mac.
Quando, per esempio, si fa un copia e incolla di dati in una tabella da un elenco di una pagina web, essi possono essere incollati in un foglio Excel o in un file di testo e, si potrà verificare che essi sono quasi illegibili e bisogna rimetterli a posto. Anche nei casi in cui fosse disponibile un link per il download del file csv, ci sarebbero comunque problemi a gestire i dati incolonnati, soprattutto per modificarli in maniera coerente. Ecco allora che si può usare Open Refine, che permette di importare questo foglio di dati e di manipolarlo in maniera facile e veloce creando una tabella da dati grezzi e copiati.
Come si può vedere nei video, si può usare la funzione "Text Facet" per vedere la sintesi dei dati di una colonna e poterli gestire in maniera aggregata, unificando quindi quelli scritti male e cancellando quelli invalidi. La funzione Trim permette di rinominare gruppi di record tutti assieme.
Si possono poi creare espressioni regolari per rinominare i dati in modo uniforme, con regole precise. Con Cluster si possono unificare interi gruppi di dati, sintetizzandoli con due click. Per i valori numerici si possono fare operazioni di somma, media e creare grafici. Tutte queste operazioni su tabelle ed elenchi che, solitamente, si fanno con Excel, si possono gestire con Open Refine in modo decisamente più veloce e facile.
Quello che mi ha spinto a dedicare un articolo a questo strumento tecnico e quello che vorrei far capire è che non si tratta di un programma destinato soltanto alle aziende o a chi lavora con enormi database. Refine infatti può essere utilizzato per mettere in ordine, rapidamente, qualsiasi lista che proviene dal copia e incolla da una pagina web e per creare tabelle copiando elenchi da qualsiasi fonte. Ad esempio, si potrebbe andare su Wikipedia, copiare la lista di attori americani e metterli in una tabella velocemente con lo strumento di trasformazione dati. A livelli avanzati poi si possono creare tannte espressioni programmabili per estrarre dati da applicazioni web come Google Maps o altre.
Open Refine è un programma che non sostituisce Excel ma consente di gestire dati e tabelle che provengono da altre fonti.
Un altro programma gratuito per Windows, Mac e Linux è CleanHaven che serve a copiare e creare tabelle oltre che a ripulire liste, dati e testi. Non solo si può convertire il testo trasformando le maiuscole in minuscole o cancellando i caratteri non stampabili ma si possono anche, ad esempio, aggregare linee separate da ritorni a capo, filtrare parole, fondere colonne di una tabella, ricerca e sostituzione di testo, rimozioni di spazi vuoti e correzione della punteggiatura. Anche CleanHaven ha una bella interfaccia pulita con menu facili da capire e da usare. CleanHaven supporta la visualizzazione tabellare, per cui si può incollare qualsiasi testo o elenco da Excel, da un file CSV, o qualsiasi altra sorgente e visualizzare questi in CleanHaven. La prima riga può diventare automaticamente l'intestazione di colonna ed i dati si possono ordinare facilmente con un click.
Sia Refine che CleanHaven possono gestire un gran numero di tabelle e diventano due programmi utili a tutti per operazioni base di copia e incolla di tabelle da internet e indispensabili per chi lavora con fogli Excel, per chi fa contabilità, per chi fa analisi dei costi, magazzino, archiviazione, segreteria e project management.
Posta un commento
Per commentare, si può usare un account Google / Gmail. Se vi piace e volete ringraziare, condividete! (senza commento). Selezionare su "Inviami notifiche" per ricevere via email le risposte Info sulla Privacy