Supervised Learning

Menengah

Jenis machine learning di mana model dilatih menggunakan data berlabel (pasangan input-output) sehingga dapat mempelajari pemetaan dari input ke output untuk prediksi data baru.

Supervised Learning adalah pendekatan machine learning di mana model belajar dari data training yang sudah memiliki label (jawaban yang benar), kemudian menggunakan pengetahuan tersebut untuk memprediksi label pada data baru yang belum pernah dilihat.

Dua Sub-tipe Supervised Learning

Klasifikasi (Classification)

Output berupa kategori diskrit:

  • Biner: Churn vs tidak churn, fraud vs normal
  • Multi-kelas: Kategori produk, jenis tiket support
  • Metrik: Accuracy, Precision, Recall, F1, AUC-ROC

Regresi (Regression)

Output berupa nilai kontinu:

  • Prediksi harga, permintaan, rating
  • Metrik: MAE, RMSE, R²

Siklus Training Supervised Learning

Alur umum: Data berlabel > Train/Val/Test split > Feature engineering > Training model > Evaluasi > Hyperparameter tuning > Evaluasi final pada test set > Deployment

Tantangan Umum

TantanganDeskripsiSolusi
OverfittingModel hafal training data, buruk di data baruRegularisasi, lebih banyak data, cross-validation
Class imbalanceDistribusi kelas tidak seimbangSMOTE, class weights, threshold tuning
Data leakageInformasi dari future masuk ke trainingStrict train/test split, time-aware splitting
Label noiseLabel training tidak akuratLabel cleaning, confident learning
Lanjut Latihan

Udah paham Supervised Learning? Lanjut latihan SQL dan Excel yuk!

Latihan interaktif, langsung di browser.

Mulai Latihan →