Ecom Clustering — Customer & Product

Cosa trovi in questa documentazione

Ogni sezione è autocontenuta. Leggi nell'ordine se vuoi una progressione didattica, oppure salta direttamente all'argomento che ti serve.

📚

Teoria, spiegata bene

Cinque articoli che costruiscono progressivamente la conoscenza: feature RFM point-in-time, K-Means vs alternative, split temporali senza leakage, metriche multiclasse e pipeline riproducibile. Con LaTeX e codice eseguibile.

Esplora la teoria

⚙️

Pipeline modulare e riproducibile

Codice modulare in Python con scikit-learn e XGBoost, StandardScaler separato dal modello di clustering, two-snapshot temporale anti-leakage e CLI ecom-cluster --quick per smoke test.

Vedi architettura

🎯

Trade-off documentati

Ogni scelta è motivata: perché K-Means come modello primario, perché GMM come confronto, perché RandomForest e XGBoost per il cluster futuro, e come interpretare la confusion matrix sui cluster di alto valore.

Leggi le decisioni

Risultati di riferimento

Cosa trovi in questa documentazione

Teoria, spiegata bene

Pipeline modulare e riproducibile

Trade-off documentati