Data Classification

Menengah

Data Classification adalah proses mengkategorikan data berdasarkan tingkat sensitivitasnya, biasanya dari Public, Internal, Confidential, sampai Restricted. Tujuannya supaya setiap data dapat perlindungan yang sesuai dengan risikonya.

Apa itu Data Classification?

Data Classification adalah proses mengkategorikan semua data yang dimiliki organisasi berdasarkan tingkat sensitivitas dan risiko kalau data itu bocor atau disalahgunakan. Ini kayak sistem labeling: tiap data punya "level kerahasiaan" yang menentukan siapa yang boleh akses dan perlindungan apa yang diperlukan.

Analoginya seperti surat di kantor pemerintahan: ada surat biasa, surat rahasia, dan surat sangat rahasia. Masing-masing punya prosedur penanganan yang berbeda.

Tingkatan Data Classification yang Umum

Nggak ada standar universal, tapi pola ini paling banyak dipakai:

LevelDefinisiContohSiapa yang Bisa Akses
PublicData yang boleh diketahui siapa sajaKonten website, press release, harga produkSemua orang, termasuk publik
InternalData untuk internal organisasi, bukan publikKebijakan internal, SOP, email perusahaanSemua karyawan
ConfidentialData sensitif dengan akses terbatasData pelanggan, laporan keuangan, strategi bisnisTim atau departemen tertentu
RestrictedData paling sensitif, akses sangat terbatasNIK, biometrik, data keuangan level direksiHanya individu yang diotorisasi secara spesifik

Kenapa Data Classification Penting?

Tanpa classification, organisasi sering jatuh ke dua ekstrem yang sama-sama bermasalah:

  1. Over-protect: semua data diperlakukan kayak data top-secret, yang bikin proses jadi lambat dan kolaborasi susah
  2. Under-protect: semua data diperlakukan sama saja, yang bikin data sensitif nggak terlindungi dengan baik

Dengan classification yang benar, proteksi bisa disesuaikan dengan risiko yang nyata. Tim data bisa kerja lebih cepat untuk data yang memang bukan sensitif, sekaligus memastikan data yang benar-benar sensitif dapat perlindungan maksimal.

Proses Data Classification

Classification bukan event satu kali, tapi proses berkelanjutan:

  • Discovery: identifikasi semua data yang dimiliki organisasi (data inventory)
  • Categorization: tentukan level untuk setiap dataset atau tipe data
  • Labeling: tandai data dengan label yang sesuai lewat metadata atau tag
  • Protection: terapkan kontrol keamanan yang sesuai dengan levelnya
  • Review: review secara berkala karena level data bisa berubah seiring waktu

Hubungan dengan Regulasi

UU PDP Indonesia mengategorikan data pribadi jadi dua: data pribadi umum dan data pribadi sensitif. Data pribadi sensitif (agama, kesehatan, keuangan, biometrik) mendapat perlindungan ekstra. Ini secara langsung berkaitan dengan Data Classification di organisasi: data sensitif menurut UU PDP biasanya masuk level Confidential atau Restricted.

Data Classification dalam Pekerjaan Data

Sebagai data practitioner, classification mempengaruhi cara kamu kerja:

  • Data Confidential atau Restricted nggak boleh di-join atau di-export sembarangan
  • Access control di data warehouse sering dibangun berdasarkan classification level
  • Query yang mengakses data Restricted biasanya butuh approval tambahan atau audit trail
Lanjut Latihan

Udah paham Data Classification? Lanjut latihan SQL dan Excel yuk!

Latihan interaktif, langsung di browser.

Mulai Latihan →