Scrivere un tool parallelo e distribuito per backup multi-terabyte

Summary

[EuroPython 2011] Marco Nenciarini - 23 June 2011 in "Track Italiana Big Mac "

"/>

Description

Una trattazione sull'uso di Python per implementare un tool per il backup giornaliero di un data warehouse di oltre 50 terabyte, basato sulla tecnologia Greenplum Database.

Questo intervento racconta la nostra esperienza, dalla raccolta dei requisiti utente alla prima release del tool, descrivendo i principali problemi incontrati e i moduli Python usati per risolverli, usando metodologie agili per lo sviluppo.

Sebbene l'applicazione non sia disponibile come progetto open-source, questo intervento fornisce degli spunti di valore a proposito dello sviluppo di applicazioni distribuite e parallele usando Python.