Contribute Media
A thank you to everyone who makes this possible: Read More

Scipy e Rpy per l'analisi degli acquisti della pubblica amministrazione

Description

Il talk propone di mostrare un caso concreto di utilizzo di python, con varie librerie, per l’analisi di dati in formato aperto in ambito economico. Tutti gli enti pubblici italiani per legge devono pubblicare un file xml liberamente accessibile con tutti i dettagli sulla spesa per acquisti di lavori, beni e servizi. Questa mole di dati può dare informazioni molto interessanti per il controllo della spesa pubblica: benchmark per gli operatori del settore, controllo diffuso sulla spesa pubblica da parte della cittadinanza, prevenzione della corruzione, ma anche analisi di mercato e confronto con i concorrenti per aziende fornitori della pubblica amministrazione. Per analizzare questa mole di dati, pubblica ormai da un anno, ma ancora poco utilizzata, ho utilizzato python per scaricare e interpretare i file xml, organizzare i dati raccolti in un database, analizzarli con indici, grafici, confronti di settore, variazione nel tempo, analisi di regressione. Le analisi sono state condotte principalmente utilizzando scipy (con anche un esempio di calcolo parallelo multiprocesso). Ho inoltre utilizzato il software statistico R tramite rpy2 per alcune analisi e per la generazione di grafici. La presentazione delle analisi è realizzata in excel con xlsxwriter, con molti grafici disegnati direttamente da excel, ma ovviamente parametrizzati in python. Per l’interpretazione dell’xml, qualche pagina web per la gestione e per tenere insieme il tutto ho utilizzato genropy. Il talk può essere interessante per mostrare come le librerie python per il calcolo scientifico possano essere utilizzate velocemente e con un tempo di apprendimento veramente minimo anche non da statistici o matematici, ma da un economista come me, per ottenere risultati magari semplici per gli esperti del settore (ho appena sfiorato la superficie delle potenzialità di questi strumenti), ma comunque strabilianti per chi è abituato a fare i conti solo con excel. Prerequisiti per una piena comprensione sono una conoscenza normale di python e un’idea di cos’è l’XML. Per quanto riguarda le librerie scipy e rpy2 il talk è assolutamente introduttivo, un esempio di come può usarle con frutto anche un totale principiante come me.

Details

Improve this page