Data Validation

Menengah

Proses memastikan data memenuhi aturan, constraint, dan standar format yang telah ditentukan sebelum digunakan dalam analisis, pelaporan, atau sistem produksi.

Data Validation adalah proses sistematis untuk memeriksa apakah data yang masuk atau yang ada dalam sistem mematuhi seperangkat aturan bisnis, format, dan constraint yang telah ditentukan.

Jenis-Jenis Validasi Data

1. Format Validation

  • Memastikan data dalam format yang benar
  • Contoh: email harus mengandung @, tanggal dalam format YYYY-MM-DD

2. Range Validation

  • Nilai numerik dalam rentang yang diperbolehkan
  • Contoh: umur antara 0-120, rating antara 1-5

3. Constraint Validation

  • Aturan integritas referensial dan bisnis
  • Contoh: order_id di tabel order_items harus ada di tabel orders

4. Completeness Validation

  • Kolom yang wajib diisi tidak boleh null
  • Contoh: customer_id, order_date wajib ada

5. Consistency Validation

  • Data konsisten antar kolom atau antar tabel
  • Contoh: ship_date tidak boleh sebelum order_date

Di Mana Validasi Diterapkan

LayerToolsKapan
DatabaseSQL CHECK constraint, FK, NOT NULLSaat INSERT/UPDATE
Pipelinedbt tests, Great ExpectationsSaat ETL/ELT berjalan
APIPydantic, CerberusSaat request masuk
AplikasiForm validationSaat user mengisi data

Validasi vs Cleansing

  • Validasi: memeriksa apakah data sesuai aturan (pass/fail)
  • Cleansing: memperbaiki data yang tidak sesuai aturan
Lanjut Latihan

Udah paham Data Validation? Lanjut latihan SQL dan Excel yuk!

Latihan interaktif, langsung di browser.

Mulai Latihan →