Model Training
Proses melatih algoritma machine learning menggunakan data berlabel sehingga model mempelajari pola dan dapat membuat prediksi yang akurat pada data baru.
Model Training adalah inti dari proses machine learning - tahap di mana algoritma mengoptimalkan parameter internalnya (bobot, koefisien) berdasarkan data training untuk meminimalkan error prediksi.
Konsep Kunci dalam Model Training
Loss Function (Fungsi Kerugian)
Mengukur seberapa jauh prediksi model dari nilai sebenarnya:
- MSE (Mean Squared Error): untuk regresi
- Binary Cross-Entropy: untuk klasifikasi biner
- Categorical Cross-Entropy: untuk multi-kelas
Optimizer
Algoritma yang mengupdate parameter berdasarkan gradient loss:
- Gradient Descent: update berdasarkan seluruh data (lambat)
- SGD (Stochastic Gradient Descent): update per satu sampel (noise)
- Adam: adaptive learning rate, konvergen cepat (paling populer)
Hyperparameter Penting
| Hyperparameter | Deskripsi | Dampak |
|---|---|---|
| Learning Rate | Seberapa besar langkah update | Terlalu besar: diverge; terlalu kecil: lambat |
| Epochs | Jumlah iterasi training penuh | Terlalu banyak: overfitting |
| Batch Size | Jumlah sampel per update | Kecil: noise tinggi; besar: memory besar |
| Regularization | Penalti kompleksitas model | Mencegah overfitting |
Training vs Validation vs Test
- Training set (~70%): data yang digunakan model untuk belajar
- Validation set (~15%): digunakan untuk tuning hyperparameter
- Test set (~15%): evaluasi final yang tidak pernah disentuh selama development
Istilah Terkait
Feature Engineering
Machine Learning & AIProses mengubah data mentah menjadi fitur (variabel input) yang lebih informatif dan relevan untuk meningkatkan performa model machine learning.
MLOps
Machine Learning & AIPraktik dan tools untuk menstandarisasi, mengotomasi, dan memonitor siklus hidup model machine learning dari pengembangan hingga deployment dan monitoring di production.
Model Deployment
Machine Learning & AIProses memindahkan model machine learning yang sudah dilatih ke lingkungan production sehingga dapat digunakan oleh aplikasi nyata untuk menghasilkan prediksi.
Udah paham Model Training? Lanjut latihan SQL dan Excel yuk!
Latihan interaktif, langsung di browser.