Data Completeness
Dimensi kualitas data yang mengukur seberapa lengkap data yang tersedia, yaitu seberapa sedikit nilai yang hilang (null, kosong, atau tidak diisi) dalam dataset.
Data Completeness adalah dimensi kualitas data yang mengukur proporsi data yang terisi dibandingkan dengan total yang seharusnya tersedia. Data yang tidak lengkap (memiliki nilai null atau missing) dapat menyebabkan analisis yang bias dan keputusan yang keliru.
Mengapa Data Tidak Lengkap?
Data bisa tidak lengkap karena berbagai alasan:
- Input tidak wajib: field optional di form tidak diisi pengguna
- Sistem error: kegagalan sinkronisasi menyebabkan field tidak terisi
- Migrasi data: field baru ditambahkan setelah data lama sudah ada
- Privacy: pengguna menolak memberikan informasi tertentu
- Data source: sumber data eksternal tidak menyediakan field tersebut
Tipe Missing Values
| Tipe | Deskripsi | Implikasi |
|---|---|---|
| MCAR (Missing Completely At Random) | Hilang secara acak, tidak ada pola | Bisa di-drop atau impute dengan aman |
| MAR (Missing At Random) | Hilang berdasarkan nilai kolom lain | Harus impute dengan mempertimbangkan kolom terkait |
| MNAR (Missing Not At Random) | Hilang karena nilai itu sendiri | Berbahaya - bisa menyebabkan bias sistematis |
Cara Menangani Missing Values
- Drop baris: jika null di kolom kritis dan proporsi kecil (<5%)
- Imputation numerik: mean/median untuk distribusi normal/skewed
- Imputation kategorikal: modus atau nilai bisnis default
- Forward fill / backward fill: untuk time series data
- Model-based imputation: gunakan kolom lain untuk memprediksi nilai yang hilang
Istilah Terkait
Data Quality
Data QualityUkuran seberapa baik data memenuhi kebutuhan penggunaannya, mencakup enam dimensi utama: akurasi, kelengkapan, konsistensi, aktualitas, validitas, dan keunikan.
Data Accuracy
Data QualityDimensi kualitas data yang mengukur seberapa benar data merepresentasikan realita atau sumber kebenaran yang seharusnya, termasuk ketepatan nilai, format, dan konteks.
Udah paham Data Completeness? Lanjut latihan SQL dan Excel yuk!
Latihan interaktif, langsung di browser.