Regression
Regression adalah teknik machine learning untuk memprediksi nilai angka yang kontinu, seperti harga rumah bulan depan, jumlah demand produk, atau revenue yang akan datang. Outputnya adalah angka, bukan kategori.
Apa itu Regression?
Regression adalah salah satu teknik paling awal dan paling banyak dipakai dalam machine learning. Intinya: kamu punya data historis, kamu latih model untuk menemukan pola, lalu pakai model itu untuk prediksi angka di masa depan atau berdasarkan input baru.
Bedanya sama Classification: regression prediksi angka (berapa?), Classification prediksi kategori (yang mana?).
Contoh Intuitif
Bayangkan kamu jual rumah dan mau tahu harga yang wajar. Kamu observasi data: rumah dengan luas 100m2 di Jakarta Selatan terjual 2 miliar, yang 150m2 terjual 2.8 miliar, yang 80m2 terjual 1.7 miliar. Regression akan menemukan garis (atau kurva) yang paling menjelaskan hubungan antara luas dan harga, lalu pakai itu untuk prediksi harga rumah 120m2 yang belum pernah terjual.
Jenis-Jenis Regression
| Tipe | Kapan Pakai | Contoh |
|---|---|---|
| Linear Regression | Hubungan linier sederhana | Prediksi sales dari budget iklan |
| Multiple Linear Regression | Beberapa variabel prediktor | Prediksi harga dari luas + lokasi + lantai |
| Polynomial Regression | Hubungan non-linier | Pertumbuhan user yang melambat di atas titik tertentu |
| Ridge/Lasso Regression | Banyak fitur, perlu regularisasi | Prediksi churn dari ratusan fitur perilaku |
| Random Forest Regression | Non-linier kompleks | Prediksi demand dengan banyak musiman |
| XGBoost Regression | Performa tinggi, kompetisi data | Prediksi harga di Kaggle |
Cara Evaluasi Model Regression
Kamu nggak bisa cuma 'ngerasa' modelnya bagus. Ada metrik standar:
- MAE (Mean Absolute Error): rata-rata selisih prediksi vs aktual. Mudah diinterpretasi dalam satuan asli.
- RMSE (Root Mean Squared Error): kayak MAE tapi kasih penalti lebih besar untuk error besar.
- R-squared: berapa persen variasi data yang bisa dijelaskan model. Nilai 1 berarti sempurna, nilai 0 berarti modelmu nggak lebih baik dari prediksi rata-rata.
Regression vs. Classification
| Aspek | Regression | Classification |
|---|---|---|
| Output | Angka kontinu | Kategori diskrit |
| Contoh output | 2.500.000.000 (harga) | 'Mahal' atau 'Murah' |
| Metrik evaluasi | MAE, RMSE, R-squared | Accuracy, F1, AUC-ROC |
| Algoritma umum | Linear Regression, XGBoost | Logistic Regression, Random Forest |
Kapan Data Analyst Butuh Regression?
Hampir setiap analyst di bisnis modern perlu regression:
- Finance: prediksi revenue kuartal depan
- Supply chain: prediksi demand untuk inventory planning
- Marketing: prediksi ROI dari kampanye iklan
- HR: prediksi attrition rate berdasarkan engagement score
Bahkan regresi sederhana yang kamu pelajari di Excel sudah masuk kategori ini. Jadi kalau kamu pernah pakai LINEST atau Trendline di spreadsheet, kamu sudah sentuh regression.
Udah paham Regression? Lanjut latihan SQL dan Excel yuk!
Latihan interaktif, langsung di browser.