Data Accuracy
Dimensi kualitas data yang mengukur seberapa benar data merepresentasikan realita atau sumber kebenaran yang seharusnya, termasuk ketepatan nilai, format, dan konteks.
Data Accuracy adalah salah satu dari enam dimensi utama Data Quality yang mengukur seberapa dekat nilai data dengan nilai sebenarnya di dunia nyata atau sumber referensi yang otoritatif.
Data Accuracy vs Dimensi Kualitas Lainnya
| Dimensi | Definisi Singkat | Contoh Masalah |
|---|---|---|
| Accuracy | Data benar merepresentasikan realita | Harga produk Rp 100.000 tapi dicatat Rp 1.000.000 |
| Completeness | Tidak ada nilai yang hilang | Kolom harga kosong |
| Validity | Sesuai format/aturan | Harga negatif |
| Consistency | Konsisten antar sistem | Harga beda di dua tabel |
| Timeliness | Data terkini | Harga sudah berubah tapi belum diupdate |
| Uniqueness | Tidak ada duplikat | Produk sama muncul dua kali |
Mengapa Akurasi Data Sulit Diukur?
Tidak seperti completeness (mudah dihitung dari null count), akurasi membutuhkan:
- Sumber kebenaran (ground truth) sebagai pembanding
- Domain knowledge untuk menentukan mana nilai yang "benar"
- Proses verifikasi yang sering membutuhkan human review
Cara Mengukur Akurasi Data
- Record linkage: bandingkan data dengan sumber otoritatif (CRM vs database resmi)
- Statistical sampling: sampling manual + review untuk estimasi tingkat kesalahan
- Business rules: flag nilai yang mustahil secara bisnis
- Cross-system reconciliation: bandingkan angka yang sama antar sistem
Istilah Terkait
Data Quality
Data QualityUkuran seberapa baik data memenuhi kebutuhan penggunaannya, mencakup enam dimensi utama: akurasi, kelengkapan, konsistensi, aktualitas, validitas, dan keunikan.
Data Completeness
Data QualityDimensi kualitas data yang mengukur seberapa lengkap data yang tersedia, yaitu seberapa sedikit nilai yang hilang (null, kosong, atau tidak diisi) dalam dataset.
Udah paham Data Accuracy? Lanjut latihan SQL dan Excel yuk!
Latihan interaktif, langsung di browser.