Cosa trovi in questa documentazione
Ogni sezione è autocontenuta. Leggi nell'ordine se vuoi una progressione didattica, oppure salta direttamente all'argomento che ti serve.
Teoria, spiegata bene
Cinque articoli che costruiscono progressivamente la conoscenza: feature RFM point-in-time, K-Means vs alternative, split temporali senza leakage, metriche multiclasse e pipeline riproducibile. Con LaTeX e codice eseguibile.
Esplora la teoriaPipeline modulare e riproducibile
Codice modulare in Python con scikit-learn e XGBoost, StandardScaler separato dal modello di clustering, two-snapshot temporale anti-leakage e CLI ecom-cluster --quick per smoke test.
Trade-off documentati
Ogni scelta è motivata: perché K-Means come modello primario, perché GMM come confronto, perché RandomForest e XGBoost per il cluster futuro, e come interpretare la confusion matrix sui cluster di alto valore.
Leggi le decisioni