Data Integrity

Pemula

Data Integrity adalah jaminan bahwa data kamu akurat, lengkap, dan konsisten sepanjang perjalanannya, dari sumber data sampai ke laporan akhir.

Bayangkan kamu lagi bikin kue. Bahan-bahannya harus pas: tepung nggak ketukar sama soda kue, takarannya harus bener, dan prosesnya harus dijaga supaya hasilnya sesuai resep. Data Integrity konsepnya mirip banget: ini adalah jaminan bahwa data kamu nggak "rusak", nggak "ketukar", dan nggak "berubah sendiri" selama perjalanan dari sumber sampai ke tangan decision maker.

Apa yang Dijaga oleh Data Integrity?

Data Integrity menjaga beberapa dimensi sekaligus:

DimensiArtinyaContoh
AkurasiData mencerminkan nilai yang sebenarnyaUmur pelanggan = 25, bukan 250
KelengkapanSemua data yang dibutuhkan adaTransaksi punya kolom tanggal, jumlah, dan ID
KonsistensiData sama di semua sistemHarga produk di database = harga di website
ValiditasData sesuai format yang ditentukanEmail harus pakai @, tanggal harus format YYYY-MM-DD
KeunikanNggak ada duplikat yang nggak diinginkan1 pelanggan = 1 ID, bukan 3 ID berbeda

Integrity di Berbagai Level

Data Integrity nggak cuma soal satu tabel. Ini berlaku di beberapa level sekaligus:

Entity Integrity: Setiap baris di tabel punya identifier yang unik. Nggak ada dua pesanan dengan order_id yang sama.

Referential Integrity: Kalau ada foreign key, data referensinya harus ada. Pesanan dari pelanggan ID 99 nggak bisa ada kalau pelanggan ID 99 nggak exist di tabel pelanggan.

Domain Integrity: Nilai di kolom harus sesuai batasannya. Kolom rating nggak boleh isi angka 6 kalau range-nya 1–5.

Kenapa Data Integrity Penting?

Kalau Data Integrity jebol, semua yang ada di downstream, termasuk analisis, dashboard, dan ML model, ikut jebol juga. Contoh nyata: platform seperti Tokopedia atau Gojek punya jutaan transaksi per hari. Kalau satu record transaksi "lari" ke buyer yang salah karena integrity-nya nggak dijaga, ini bisa jadi masalah finansial dan kepercayaan yang serius.

Data Integrity juga punya aspek keamanan: data nggak boleh diubah oleh pihak yang nggak berwenang, baik karena bug maupun karena serangan dari luar.

Cara Menjaga Data Integrity

Beberapa langkah yang bisa kamu ambil:

  • Pasang constraints di database (NOT NULL, UNIQUE, FOREIGN KEY, CHECK)
  • Validasi input di aplikasi sebelum data masuk ke database
  • Lakukan data quality checks secara rutin dalam pipeline
  • Buat audit log untuk tracking setiap perubahan data

Kunci utamanya adalah nggak mengandalkan satu lapisan saja. Integrity yang kuat itu berlapis: dari constraint di database, validasi di aplikasi, sampai testing di pipeline.

Lanjut Latihan

Udah paham Data Integrity? Lanjut latihan SQL dan Excel yuk!

Latihan interaktif, langsung di browser.

Mulai Latihan →