Travailler avec des Data Lakehouses en Python, sans Spark

MP4
PeerTube

Description

Beaucoup d'équipes utilisent Spark pour traiter de petites et moyennes quantités de données, complexifiant inutilement leurs projets. Cette présentation montre comment utiliser les formats Data Lakehouse (Delta Lake, Apache Iceberg) directement en Python, sans Spark.

Nous verrons comment obtenir les fonctionnalités avancées (tables ACID, historique des versions) avec des bibliothèques Python telles que delta-rs et pyiceberg, ainsi que des intégrations comme DuckDB.

Cette conférence s'adresse aux ingénieurs data, ingénieurs ML et data scientists souhaitant simplifier leur stack technique sans perdre les fonctionnalités essentielles.

PyVideo

Travailler avec des Data Lakehouses en Python, sans Spark

Description

Details