Progetto R
Grazie a un mio amico (che conoscerete fra un po’ in una delle mie chiacchierate) che si occupa di queste cose ho scoperto che esiste un prodotto freeware specializzato per il calcolo statistico.
R è un ambiente di lavoro che consente di lavorare interattivamente sui dati e visualizzare graficamente i risultati delle analisi. Il codice sorgente è a disposizione di tutti e compila sotto Linux, UNIX, Windows e MacOS. Io ho installato l’eseguibile per piattaforma Windows a 64 bit senza alcun problema. Il progetto R, poi, comprende anche una comunità di sviluppatori, una rivista di statistica e un bel po’ di mailing list. Si tratta di una comunità numerosa e in fervente attività.
Abbiamo visto la console interattiva anche con PAW. E’ inevitabile che il suo uso necessiti di una fase di apprendimento ma alla lunga la sua enorme flessibilità non può che produrre risultati migliori rispetto ad un’interfaccia “bloccata” dove si utilizzano menù e finestre di settaggi.
Io ho seguito questo tutorial riproducendone senza difficoltà tutti i passi. A essere onesti, è singolare che si debba indicare via menù la directory di lavoro e poi caricare il file via console piuttosto che avere un menù di caricamento diretto del file di input: è un sintomo di come l’interfaccia non sia stata progettata con grande attenzione. Tuttavia basta vedere il dettaglio dei risultati di una semplice regressione lineare per rimanere stupiti.
Il programma è estendibile mediante l’installazione di moduli esterni (ad oggi sono più di 2500) ed esiste anche un manuale per scrivere un proprio modulo. Esistono dei moduli per collegarsi a database come Oracle, MySql, PostgreSQL,SQLite. Non mi pare che esista un modulo per collegarsi a SQL Server ma ne esiste uno per JDBC.
Per le mie piccole analisi statistiche credo che userò questo software che,a differenza di PAW, si fonda su una comunità di programmatori in continua evoluzione.
Voglio poi esprimere il mio rammarico sul fatto che non esista nulla di simile sviluppato dalla Microsoft sotto .NET. Il collegamento ai database sarebbe immediato con motori di querying flessibili e veloci, potremmo scegliere il linguaggio con cui scrivere le istruzioni interattive e avere a disposizione le DirectX per la rappresentazione grafica. Possibile che dipenda tutto dal mercato?