Passa al contenuto principale

Credit Card Fraud — ML Pipeline

Pipeline ML per fraud detection con classificazione sbilanciata, feature temporali, ottimizzazione della soglia di decisione.

Risultati di riferimento

Metriche misurate sul holdout test set dopo tuning K-fold del modello vincente.

PR-AUC atteso
0.85+
XGBoost full tuning
Recall@P=0.5
~0.78
soglia operativa
Class imbalance
0.5%
frodi nel dataset

Cosa trovi in questa documentazione

Ogni sezione è autocontenuta. Leggi nell'ordine se vuoi una progressione didattica, oppure salta direttamente all'argomento che ti serve.

Teoria, spiegata bene

Sei articoli su classificazione sbilanciata, metriche per fraud detection, feature temporali, split temporale, modelli supervisionati, threshold tuning.

Esplora la teoria

Pipeline production-ready

Codice modulare in Python con scikit-learn + XGBoost, feature engineering time-aware, gestione class imbalance, threshold optimization, CLI fraud-train.

Vedi l'architettura

Trade-off documentati

Ogni scelta è motivata: perché LogReg+RF+XGB, come gestire imbalance, come scegliere la soglia operativa, dove sono i limiti del modello.

Leggi le decisioni