Description
Dans le monde des données, les incohérences ou les imprécisions représentent souvent un obstacle majeur à l’extraction d’informations pertinentes. Pourtant, les outils et pratiques robustes pour y faire face restent limités. En particulier, la pratique du TDD (Test-Driven Development) reste difficile en data science, alors qu’elle est devenue un standard dans le développement logiciel classique, notamment à cause d’outils et de frameworks mal adaptés.
Pour répondre à ce problème, nous avons développé Pelage, un package Python open-source conçu pour faciliter l’exploration et les tests de données, en s’appuyant sur la syntaxe intuitive et la rapidité de Polars. Pelage permet aux data scientists et analystes de transformer les données plus facilement, d’améliorer leur qualité et de rendre le code plus clair.
Nous démontrerons, dans une approche orientée tests, comment utiliser cette bibliothèque dans un workflow data science pour renforcer la confiance dans vos transformations de données.
[Lien GitHub](https://alixtc.github.io/pelage/)