Passa al contenuto principale

Ecom Clustering — Customer & Product

Pipeline end-to-end per il clustering RFM di utenti e prodotti, con predizione cluster futuro a horizon di 30/90 giorni.

Risultati di riferimento

Metriche orientative misurate sull'holdout temporale dopo selezione di K via silhouette e training del classificatore supervisionato del cluster futuro.

Cluster utenti (K)
4–6
KMeans + silhouette
Macro-F1 supervisionato
0.70–0.85
predizione cluster futuro
Balanced accuracy
0.75–0.90
holdout test

Cosa trovi in questa documentazione

Ogni sezione è autocontenuta. Leggi nell'ordine se vuoi una progressione didattica, oppure salta direttamente all'argomento che ti serve.

Teoria, spiegata bene

Cinque articoli che costruiscono progressivamente la conoscenza: feature RFM point-in-time, K-Means vs alternative, split temporali senza leakage, metriche multiclasse e pipeline riproducibile. Con LaTeX e codice eseguibile.

Esplora la teoria

Pipeline modulare e riproducibile

Codice modulare in Python con scikit-learn e XGBoost, StandardScaler separato dal modello di clustering, two-snapshot temporale anti-leakage e CLI ecom-cluster --quick per smoke test.

Vedi architettura

Trade-off documentati

Ogni scelta è motivata: perché K-Means come modello primario, perché GMM come confronto, perché RandomForest e XGBoost per il cluster futuro, e come interpretare la confusion matrix sui cluster di alto valore.

Leggi le decisioni