Passa al contenuto principale

Ames Housing — ML Pipeline

Pipeline end-to-end per la previsione dei prezzi immobiliari sul dataset Ames (De Cock 2011)

Risultati di riferimento

Metriche misurate sul holdout test set dopo tuning K-fold del modello vincente.

Best RMSE (XGBoost)
$18,350
holdout test set
R² holdout
0.9471
varianza spiegata
MAPE
7.19%
errore percentuale medio

Cosa trovi in questa documentazione

Ogni sezione è autocontenuta. Leggi nell'ordine se vuoi una progressione didattica, oppure salta direttamente all'argomento che ti serve.

Teoria, spiegata bene

Cinque articoli che costruiscono progressivamente la conoscenza: regressione lineare, regolarizzazione, modelli tree-based, metriche e prevenzione del data leakage. Con LaTeX e codice eseguibile.

Esplora la teoria

Pipeline production-ready

Codice modulare in Python con scikit-learn e XGBoost, ColumnTransformer per il preprocessing, TransformedTargetRegressor sul log-target, tuning K-fold riproducibile e CLI ames-train --quick.

Vedi l'architettura

Trade-off documentati

Ogni scelta è motivata: perché Ridge come baseline, perché XGBoost come challenger, quali iperparametri tunare, come interpretare le metriche e dove sono i limiti del modello.

Leggi le decisioni