Question 1

Apa itu Model Evaluation?

Accepted Answer

Proses mengukur seberapa baik performa model ML menggunakan berbagai metrik, untuk memastikan model benar-benar berguna sebelum dipakai di dunia nyata.

Question 2

Kapan Model Evaluation digunakan?

Accepted Answer

Tim data science bank yang evaluasi model credit scoring dengan fokus ke recall untuk minimalkan lolos nasabah berisiko tinggi. Platform e-commerce yang evaluasi model rekomendasi dengan metrik click-through rate dan conversion, bukan cuma accuracy offline. Startup healthtech yang evaluasi model deteksi penyakit dengan AUC-ROC sebagai metrik utama karena butuh performa yang baik di berbagai threshold

Question 3

Apa kesalahpahaman umum tentang Model Evaluation?

Accepted Answer

"Accuracy tinggi berarti model bagus." Nggak selalu, kalau dataset-nya imbalanced, accuracy bisa sangat menipu. Cek juga precision, recall, dan F1 sebelum ambil kesimpulan.. "Evaluasi cukup dilakukan sekali sebelum deploy." Banyak yang kira gitu, padahal model perlu re-evaluasi secara berkala setelah deploy karena distribusi data bisa berubah (model drift).

Metrik	Kapan Prioritaskan
Accuracy	Data seimbang, cost error semua kelas sama
Precision	Ketika false positive mahal (spam filter)
Recall	Ketika false negative mahal (deteksi penyakit)
F1 Score	Data imbalanced, butuh keseimbangan precision-recall
AUC-ROC	Evaluasi kemampuan diskriminasi keseluruhan model

Metrik	Kepanjangan	Karakteristik
MAE	Mean Absolute Error	Mudah diinterpretasi, robust terhadap outlier
RMSE	Root Mean Squared Error	Penalize error besar lebih berat
MAPE	Mean Absolute Percentage Error	Mudah dipahami bisnis (dalam persen)

Model Evaluation

Apa Itu Model Evaluation?

Metrik Utama Classification

Metrik untuk Regression

Konsep Penting: Confusion Matrix

Pitfall Umum dalam Evaluasi