Question 1

Apa itu Data Drift?

Accepted Answer

Pergeseran perlahan pada distribusi atau karakteristik data dari waktu ke waktu, yang bikin model machine learning atau laporan analitik jadi makin nggak akurat meski kodenya nggak berubah.

Question 2

Kapan Data Drift digunakan?

Accepted Answer

Monitoring performa model credit scoring di perusahaan fintech seperti Kredivo atau Akulaku. Deteksi pergeseran perilaku pengguna di platform e-commerce setelah perubahan besar pasar. Quality assurance pada model prediksi demand di supply chain retail. Validasi model HR analytics ketika pola rekrutmen berubah akibat kondisi pasar kerja baru

Question 3

Apa kesalahpahaman umum tentang Data Drift?

Accepted Answer

Banyak yang kira drift berarti datanya salah. Padahal datanya bisa valid secara teknis, tapi distribusinya udah beda dari saat training sehingga model jadi kurang relevan.. Ada anggapan retrain model sekali cukup untuk selamanya. Padahal drift bisa terjadi kapan saja, jadi monitoring dan retraining perlu dijadwalkan secara berkala.. Data drift dianggap cuma masalah tim ML. Padahal analis dan BI juga kena dampak: tren historis yang dipakai sebagai benchmark bisa udah nggak relevan untuk kondisi sekarang.

Tipe	Yang Berubah	Dampak Langsung
Feature Drift (Covariate Shift)	Distribusi input data (X) berubah	Model dapat input yang 'asing' dari saat training
Label Drift (Prior Probability Shift)	Distribusi target/output (Y) berubah	Proporsi kelas berubah, threshold model jadi off
Concept Drift	Hubungan antara X dan Y berubah	Pola lama udah nggak relevan, model salah secara struktural

Data Drift

Apa itu Data Drift?

Tiga Tipe Utama Data Drift

Contoh Nyata di Industri Indonesia

Drift vs Data Quality Issue

Cara Monitoring Data Drift