Active
0.1.1
Go
CLI
Windows
Linux
MacOS
Preprocess
Outil CLI multiplateforme rapide pour le prétraitement et l'analyse de données tabulaires
—
Stars
—
Forks
—
Issues ouvertes
—
Dernier push
Fonctionnalités
- Prétraitement rapide de fichiers de données tabulaires (CSV, TSV…)
- Opérations de groupement, d'agrégation et de résumé statistique
- Calcul de différences entre deux versions d'un dataset
- Skim — aperçu instantané de la structure et des types d'un fichier
- Mise à l'échelle et normalisation des colonnes numériques
- Installation en une commande sur Linux, macOS et Windows
- Distribué via GoReleaser pour des binaires natifs optimisés
Preprocess est un outil en ligne de commande écrit en Go, conçu pour accélérer les tâches répétitives de prétraitement de données. Il cible les analystes et développeurs qui travaillent avec des fichiers tabulaires (CSV, TSV) et veulent une alternative rapide et scriptable aux outils graphiques.
Installation
Linux / macOS
curl -LsSf https://preprocess-cli.netlify.app/install.sh | sh
Windows
powershell -ExecutionPolicy ByPass -c "irm https://preprocess-cli.netlify.app/install.ps1 | iex"
Ou téléchargez le binaire directement depuis la page des releases GitHub.
Exemples d’utilisation
# Aperçu rapide du fichier
preprocess skim data.csv
# Statistiques descriptives
preprocess statistics data.csv
# Groupement par colonne
preprocess group data.csv --by country
# Différences entre deux fichiers
preprocess diff before.csv after.csv
Changelog
Fix
0.1.1
Feature
0.1.0