Time Series Forecasting

Menengah

Teknik prediksi nilai masa depan berdasarkan data historis yang dicatat secara berurutan berdasarkan waktu, seperti prediksi penjualan bulan depan atau permintaan produk minggu depan.

Apa Itu Time Series Forecasting?

Kalau kamu pernah lihat grafik penjualan harian, harga saham, atau suhu udara dari waktu ke waktu, kamu udah lihat Time Series. Time Series Forecasting adalah seni dan ilmu memprediksi bagian grafik itu yang belum terjadi.

Bedanya dengan prediksi biasa: di Time Series, urutan data itu penting banget. Data hari Senin mempengaruhi prediksi hari Selasa. Ada pola yang berulang setiap minggu, bulan, atau tahun. Ini yang bikin Time Series punya karakteristik unik dibanding masalah ML lainnya.

Komponen Time Series

Sebelum bisa forecast, penting ngerti dulu apa yang menyusun sebuah Time Series:

KomponenDeskripsiContoh
TrendPergerakan naik atau turun jangka panjangPenjualan e-commerce terus naik tiap tahun
SeasonalityPola berulang dalam periode tertentuPenjualan tinggi tiap Lebaran atau Natal
CyclicalityFluktuasi jangka panjang yang nggak regulerSiklus ekonomi yang mempengaruhi demand
NoiseVariasi acak yang nggak bisa diprediksiLonjakan penjualan karena viral dadakan

Pendekatan dan Model

KondisiRekomendasi Model
Data sedikit, pattern sederhanaARIMA atau Exponential Smoothing
Ada seasonality jelas dan holiday effectsProphet
Banyak time series sekaligus (hierarchical)LightGBM atau model global
Pola sangat kompleks, data berlimpahLSTM atau Temporal Fusion Transformer

Model Statistik Klasik: ARIMA solid untuk data yang stasioner. SARIMA bisa handle seasonality. Exponential Smoothing kasih bobot lebih besar ke data terbaru dan seringkali efektif untuk kebutuhan bisnis sehari-hari.

Model ML Modern: Prophet dari Meta user-friendly dan bisa handle holiday effects. XGBoost atau LightGBM bisa dipakai kalau fitur-fitur lag dan window statistics direkayasa dengan baik.

Konsep Penting

Stationarity: Banyak model statistik butuh data yang stasioner (mean dan varian konstan sepanjang waktu). Kalau nggak, perlu transformasi dulu.

Look-ahead bias: Hati-hati nggak pakai informasi masa depan saat training. Ini jenis data leakage yang spesifik untuk Time Series dan bisa bikin model kelihatan bagus padahal nggak valid.

Evaluasi yang benar: Jangan split data secara random! Selalu pakai time-based split: data lama untuk training, data terbaru untuk testing. Walk-forward validation lebih robust lagi karena mensimulasikan kondisi produksi yang nyata.

Kualitas forecast biasanya menurun seiring makin panjang horizon prediksi. Prediksi besok jauh lebih akurat dari prediksi 3 bulan lagi, dan itu normal.

Lanjut Latihan

Udah paham Time Series Forecasting? Lanjut latihan SQL dan Excel yuk!

Latihan interaktif, langsung di browser.

Mulai Latihan →