Model Training

Menengah

Proses melatih algoritma machine learning menggunakan data berlabel sehingga model mempelajari pola dan dapat membuat prediksi yang akurat pada data baru.

Model Training adalah inti dari proses machine learning - tahap di mana algoritma mengoptimalkan parameter internalnya (bobot, koefisien) berdasarkan data training untuk meminimalkan error prediksi.

Konsep Kunci dalam Model Training

Loss Function (Fungsi Kerugian)

Mengukur seberapa jauh prediksi model dari nilai sebenarnya:

  • MSE (Mean Squared Error): untuk regresi
  • Binary Cross-Entropy: untuk klasifikasi biner
  • Categorical Cross-Entropy: untuk multi-kelas

Optimizer

Algoritma yang mengupdate parameter berdasarkan gradient loss:

  • Gradient Descent: update berdasarkan seluruh data (lambat)
  • SGD (Stochastic Gradient Descent): update per satu sampel (noise)
  • Adam: adaptive learning rate, konvergen cepat (paling populer)

Hyperparameter Penting

HyperparameterDeskripsiDampak
Learning RateSeberapa besar langkah updateTerlalu besar: diverge; terlalu kecil: lambat
EpochsJumlah iterasi training penuhTerlalu banyak: overfitting
Batch SizeJumlah sampel per updateKecil: noise tinggi; besar: memory besar
RegularizationPenalti kompleksitas modelMencegah overfitting

Training vs Validation vs Test

  • Training set (~70%): data yang digunakan model untuk belajar
  • Validation set (~15%): digunakan untuk tuning hyperparameter
  • Test set (~15%): evaluasi final yang tidak pernah disentuh selama development
Lanjut Latihan

Udah paham Model Training? Lanjut latihan SQL dan Excel yuk!

Latihan interaktif, langsung di browser.

Mulai Latihan →