PII
Personally Identifiable Information
PII adalah data apa pun yang bisa dipakai untuk mengidentifikasi seseorang secara spesifik, baik langsung maupun kalau digabungkan dengan data lain. Nama, NIK, nomor HP, dan email termasuk kategori ini.
Apa itu PII?
PII atau Personally Identifiable Information adalah informasi apa pun yang bisa digunakan untuk mengidentifikasi satu orang secara spesifik. Kalau data itu bisa menjawab pertanyaan "ini milik siapa?", kemungkinan besar itu adalah PII.
Banyak yang mengira PII cuma nama dan nomor KTP. Padahal definisinya jauh lebih luas dari itu.
Dua Jenis PII
PII dibagi jadi dua kategori besar:
| Jenis | Deskripsi | Contoh |
|---|---|---|
| PII Langsung (Direct) | Bisa identifikasi seseorang tanpa perlu data lain | NIK, nomor paspor, nama lengkap, nomor HP |
| PII Tidak Langsung (Indirect) | Perlu digabungkan dengan data lain baru bisa identifikasi | Tanggal lahir, kota asal, jenis kelamin, kode pos |
Yang sering bikin orang kaget: kombinasi dari data indirect bisa jadi sangat powerful. Misalnya, "perempuan, lahir 1990-03-15, tinggal di Denpasar" mungkin sudah cukup untuk mengidentifikasi satu orang tertentu.
Contoh PII di Konteks Indonesia
- Identitas resmi: NIK (Nomor Induk Kependudukan), nomor paspor, SIM, NPWP, BPJS
- Kontak: alamat email, nomor HP/WA, alamat rumah
- Biometrik: foto wajah, sidik jari, data iris mata
- Digital: username, alamat IP, cookies, device ID
- Finansial: nomor rekening, nomor kartu kredit, riwayat transaksi
Kenapa PII Penting Banget?
Di dunia data, PII adalah salah satu kategori data yang paling sensitif dan paling diatur secara hukum. Kalau perusahaan kamu menyimpan atau memproses PII pengguna, ada kewajiban hukum dan etis yang harus dipenuhi, mulai dari UU PDP Indonesia sampai regulasi internasional kalau kamu handle data dari luar negeri.
Risiko kebocoran PII bisa berdampak langsung ke individu: identitas bisa dicuri, rekening bisa dibobol, atau seseorang bisa jadi korban fraud.
PII dalam Pekerjaan Data
Sebagai data practitioner, kamu perlu tahu PII ada di mana dalam pipeline-mu. Beberapa pendekatan umum:
- Pseudonymization: ganti nilai PII dengan token atau ID yang nggak meaningful (nama diganti dengan user_id)
- Anonymization: hapus atau ubah data sedemikian rupa sehingga nggak bisa di-trace kembali ke individu
- Data masking: sembunyikan sebagian nilai, misalnya menampilkan empat bintang diikuti empat digit terakhir untuk nomor kartu
Pemahaman tentang PII jadi landasan untuk banyak topik governance lain: Data Classification, Data Privacy, dan kepatuhan regulasi.
Udah paham PII? Lanjut latihan SQL dan Excel yuk!
Latihan interaktif, langsung di browser.