Regression adalah teknik machine learning untuk memprediksi nilai angka yang kontinu, seperti harga rumah bulan depan, jumlah demand produk, atau revenue yang akan datang. Outputnya adalah angka, bukan kategori.

Apa itu Regression?

Regression adalah salah satu teknik paling awal dan paling banyak dipakai dalam machine learning. Intinya: kamu punya data historis, kamu latih model untuk menemukan pola, lalu pakai model itu untuk prediksi angka di masa depan atau berdasarkan input baru.

Bedanya sama Classification: regression prediksi angka (berapa?), Classification prediksi kategori (yang mana?).

Contoh Intuitif

Bayangkan kamu jual rumah dan mau tahu harga yang wajar. Kamu observasi data: rumah dengan luas 100m2 di Jakarta Selatan terjual 2 miliar, yang 150m2 terjual 2.8 miliar, yang 80m2 terjual 1.7 miliar. Regression akan menemukan garis (atau kurva) yang paling menjelaskan hubungan antara luas dan harga, lalu pakai itu untuk prediksi harga rumah 120m2 yang belum pernah terjual.

Jenis-Jenis Regression

TipeKapan PakaiContoh
Linear RegressionHubungan linier sederhanaPrediksi sales dari budget iklan
Multiple Linear RegressionBeberapa variabel prediktorPrediksi harga dari luas + lokasi + lantai
Polynomial RegressionHubungan non-linierPertumbuhan user yang melambat di atas titik tertentu
Ridge/Lasso RegressionBanyak fitur, perlu regularisasiPrediksi churn dari ratusan fitur perilaku
Random Forest RegressionNon-linier kompleksPrediksi demand dengan banyak musiman
XGBoost RegressionPerforma tinggi, kompetisi dataPrediksi harga di Kaggle

Cara Evaluasi Model Regression

Kamu nggak bisa cuma 'ngerasa' modelnya bagus. Ada metrik standar:

  • MAE (Mean Absolute Error): rata-rata selisih prediksi vs aktual. Mudah diinterpretasi dalam satuan asli.
  • RMSE (Root Mean Squared Error): kayak MAE tapi kasih penalti lebih besar untuk error besar.
  • R-squared: berapa persen variasi data yang bisa dijelaskan model. Nilai 1 berarti sempurna, nilai 0 berarti modelmu nggak lebih baik dari prediksi rata-rata.

Regression vs. Classification

AspekRegressionClassification
OutputAngka kontinuKategori diskrit
Contoh output2.500.000.000 (harga)'Mahal' atau 'Murah'
Metrik evaluasiMAE, RMSE, R-squaredAccuracy, F1, AUC-ROC
Algoritma umumLinear Regression, XGBoostLogistic Regression, Random Forest

Kapan Data Analyst Butuh Regression?

Hampir setiap analyst di bisnis modern perlu regression:

  • Finance: prediksi revenue kuartal depan
  • Supply chain: prediksi demand untuk inventory planning
  • Marketing: prediksi ROI dari kampanye iklan
  • HR: prediksi attrition rate berdasarkan engagement score

Bahkan regresi sederhana yang kamu pelajari di Excel sudah masuk kategori ini. Jadi kalau kamu pernah pakai LINEST atau Trendline di spreadsheet, kamu sudah sentuh regression.

Lanjut Latihan

Udah paham Regression? Lanjut latihan SQL dan Excel yuk!

Latihan interaktif, langsung di browser.

Mulai Latihan →