Supervised Learning
Jenis machine learning di mana model dilatih menggunakan data berlabel (pasangan input-output) sehingga dapat mempelajari pemetaan dari input ke output untuk prediksi data baru.
Supervised Learning adalah pendekatan machine learning di mana model belajar dari data training yang sudah memiliki label (jawaban yang benar), kemudian menggunakan pengetahuan tersebut untuk memprediksi label pada data baru yang belum pernah dilihat.
Dua Sub-tipe Supervised Learning
Klasifikasi (Classification)
Output berupa kategori diskrit:
- Biner: Churn vs tidak churn, fraud vs normal
- Multi-kelas: Kategori produk, jenis tiket support
- Metrik: Accuracy, Precision, Recall, F1, AUC-ROC
Regresi (Regression)
Output berupa nilai kontinu:
- Prediksi harga, permintaan, rating
- Metrik: MAE, RMSE, R²
Siklus Training Supervised Learning
Alur umum: Data berlabel > Train/Val/Test split > Feature engineering > Training model > Evaluasi > Hyperparameter tuning > Evaluasi final pada test set > Deployment
Tantangan Umum
| Tantangan | Deskripsi | Solusi |
|---|---|---|
| Overfitting | Model hafal training data, buruk di data baru | Regularisasi, lebih banyak data, cross-validation |
| Class imbalance | Distribusi kelas tidak seimbang | SMOTE, class weights, threshold tuning |
| Data leakage | Informasi dari future masuk ke training | Strict train/test split, time-aware splitting |
| Label noise | Label training tidak akurat | Label cleaning, confident learning |
Istilah Terkait
Deep Learning
Machine Learning & AISubset dari Machine Learning yang menggunakan jaringan saraf tiruan berlapis-lapis (neural network) untuk belajar representasi data secara hierarkis dari data besar.
Unsupervised Learning
Machine Learning & AIJenis machine learning di mana model menemukan pola, struktur, dan kelompok tersembunyi dari data tanpa menggunakan label atau jawaban yang telah ditentukan sebelumnya.
Udah paham Supervised Learning? Lanjut latihan SQL dan Excel yuk!
Latihan interaktif, langsung di browser.