Time Series Forecasting
Teknik prediksi nilai masa depan berdasarkan data historis yang dicatat secara berurutan berdasarkan waktu, seperti prediksi penjualan bulan depan atau permintaan produk minggu depan.
Apa Itu Time Series Forecasting?
Kalau kamu pernah lihat grafik penjualan harian, harga saham, atau suhu udara dari waktu ke waktu, kamu udah lihat Time Series. Time Series Forecasting adalah seni dan ilmu memprediksi bagian grafik itu yang belum terjadi.
Bedanya dengan prediksi biasa: di Time Series, urutan data itu penting banget. Data hari Senin mempengaruhi prediksi hari Selasa. Ada pola yang berulang setiap minggu, bulan, atau tahun. Ini yang bikin Time Series punya karakteristik unik dibanding masalah ML lainnya.
Komponen Time Series
Sebelum bisa forecast, penting ngerti dulu apa yang menyusun sebuah Time Series:
| Komponen | Deskripsi | Contoh |
|---|---|---|
| Trend | Pergerakan naik atau turun jangka panjang | Penjualan e-commerce terus naik tiap tahun |
| Seasonality | Pola berulang dalam periode tertentu | Penjualan tinggi tiap Lebaran atau Natal |
| Cyclicality | Fluktuasi jangka panjang yang nggak reguler | Siklus ekonomi yang mempengaruhi demand |
| Noise | Variasi acak yang nggak bisa diprediksi | Lonjakan penjualan karena viral dadakan |
Pendekatan dan Model
| Kondisi | Rekomendasi Model |
|---|---|
| Data sedikit, pattern sederhana | ARIMA atau Exponential Smoothing |
| Ada seasonality jelas dan holiday effects | Prophet |
| Banyak time series sekaligus (hierarchical) | LightGBM atau model global |
| Pola sangat kompleks, data berlimpah | LSTM atau Temporal Fusion Transformer |
Model Statistik Klasik: ARIMA solid untuk data yang stasioner. SARIMA bisa handle seasonality. Exponential Smoothing kasih bobot lebih besar ke data terbaru dan seringkali efektif untuk kebutuhan bisnis sehari-hari.
Model ML Modern: Prophet dari Meta user-friendly dan bisa handle holiday effects. XGBoost atau LightGBM bisa dipakai kalau fitur-fitur lag dan window statistics direkayasa dengan baik.
Konsep Penting
Stationarity: Banyak model statistik butuh data yang stasioner (mean dan varian konstan sepanjang waktu). Kalau nggak, perlu transformasi dulu.
Look-ahead bias: Hati-hati nggak pakai informasi masa depan saat training. Ini jenis data leakage yang spesifik untuk Time Series dan bisa bikin model kelihatan bagus padahal nggak valid.
Evaluasi yang benar: Jangan split data secara random! Selalu pakai time-based split: data lama untuk training, data terbaru untuk testing. Walk-forward validation lebih robust lagi karena mensimulasikan kondisi produksi yang nyata.
Kualitas forecast biasanya menurun seiring makin panjang horizon prediksi. Prediksi besok jauh lebih akurat dari prediksi 3 bulan lagi, dan itu normal.
Udah paham Time Series Forecasting? Lanjut latihan SQL dan Excel yuk!
Latihan interaktif, langsung di browser.