Data Classification
Data Classification adalah proses mengkategorikan data berdasarkan tingkat sensitivitasnya, biasanya dari Public, Internal, Confidential, sampai Restricted. Tujuannya supaya setiap data dapat perlindungan yang sesuai dengan risikonya.
Apa itu Data Classification?
Data Classification adalah proses mengkategorikan semua data yang dimiliki organisasi berdasarkan tingkat sensitivitas dan risiko kalau data itu bocor atau disalahgunakan. Ini kayak sistem labeling: tiap data punya "level kerahasiaan" yang menentukan siapa yang boleh akses dan perlindungan apa yang diperlukan.
Analoginya seperti surat di kantor pemerintahan: ada surat biasa, surat rahasia, dan surat sangat rahasia. Masing-masing punya prosedur penanganan yang berbeda.
Tingkatan Data Classification yang Umum
Nggak ada standar universal, tapi pola ini paling banyak dipakai:
| Level | Definisi | Contoh | Siapa yang Bisa Akses |
|---|---|---|---|
| Public | Data yang boleh diketahui siapa saja | Konten website, press release, harga produk | Semua orang, termasuk publik |
| Internal | Data untuk internal organisasi, bukan publik | Kebijakan internal, SOP, email perusahaan | Semua karyawan |
| Confidential | Data sensitif dengan akses terbatas | Data pelanggan, laporan keuangan, strategi bisnis | Tim atau departemen tertentu |
| Restricted | Data paling sensitif, akses sangat terbatas | NIK, biometrik, data keuangan level direksi | Hanya individu yang diotorisasi secara spesifik |
Kenapa Data Classification Penting?
Tanpa classification, organisasi sering jatuh ke dua ekstrem yang sama-sama bermasalah:
- Over-protect: semua data diperlakukan kayak data top-secret, yang bikin proses jadi lambat dan kolaborasi susah
- Under-protect: semua data diperlakukan sama saja, yang bikin data sensitif nggak terlindungi dengan baik
Dengan classification yang benar, proteksi bisa disesuaikan dengan risiko yang nyata. Tim data bisa kerja lebih cepat untuk data yang memang bukan sensitif, sekaligus memastikan data yang benar-benar sensitif dapat perlindungan maksimal.
Proses Data Classification
Classification bukan event satu kali, tapi proses berkelanjutan:
- Discovery: identifikasi semua data yang dimiliki organisasi (data inventory)
- Categorization: tentukan level untuk setiap dataset atau tipe data
- Labeling: tandai data dengan label yang sesuai lewat metadata atau tag
- Protection: terapkan kontrol keamanan yang sesuai dengan levelnya
- Review: review secara berkala karena level data bisa berubah seiring waktu
Hubungan dengan Regulasi
UU PDP Indonesia mengategorikan data pribadi jadi dua: data pribadi umum dan data pribadi sensitif. Data pribadi sensitif (agama, kesehatan, keuangan, biometrik) mendapat perlindungan ekstra. Ini secara langsung berkaitan dengan Data Classification di organisasi: data sensitif menurut UU PDP biasanya masuk level Confidential atau Restricted.
Data Classification dalam Pekerjaan Data
Sebagai data practitioner, classification mempengaruhi cara kamu kerja:
- Data Confidential atau Restricted nggak boleh di-join atau di-export sembarangan
- Access control di data warehouse sering dibangun berdasarkan classification level
- Query yang mengakses data Restricted biasanya butuh approval tambahan atau audit trail
Udah paham Data Classification? Lanjut latihan SQL dan Excel yuk!
Latihan interaktif, langsung di browser.