PII

Personally Identifiable Information

Pemula

PII adalah data apa pun yang bisa dipakai untuk mengidentifikasi seseorang secara spesifik, baik langsung maupun kalau digabungkan dengan data lain. Nama, NIK, nomor HP, dan email termasuk kategori ini.

Apa itu PII?

PII atau Personally Identifiable Information adalah informasi apa pun yang bisa digunakan untuk mengidentifikasi satu orang secara spesifik. Kalau data itu bisa menjawab pertanyaan "ini milik siapa?", kemungkinan besar itu adalah PII.

Banyak yang mengira PII cuma nama dan nomor KTP. Padahal definisinya jauh lebih luas dari itu.

Dua Jenis PII

PII dibagi jadi dua kategori besar:

JenisDeskripsiContoh
PII Langsung (Direct)Bisa identifikasi seseorang tanpa perlu data lainNIK, nomor paspor, nama lengkap, nomor HP
PII Tidak Langsung (Indirect)Perlu digabungkan dengan data lain baru bisa identifikasiTanggal lahir, kota asal, jenis kelamin, kode pos

Yang sering bikin orang kaget: kombinasi dari data indirect bisa jadi sangat powerful. Misalnya, "perempuan, lahir 1990-03-15, tinggal di Denpasar" mungkin sudah cukup untuk mengidentifikasi satu orang tertentu.

Contoh PII di Konteks Indonesia

  • Identitas resmi: NIK (Nomor Induk Kependudukan), nomor paspor, SIM, NPWP, BPJS
  • Kontak: alamat email, nomor HP/WA, alamat rumah
  • Biometrik: foto wajah, sidik jari, data iris mata
  • Digital: username, alamat IP, cookies, device ID
  • Finansial: nomor rekening, nomor kartu kredit, riwayat transaksi

Kenapa PII Penting Banget?

Di dunia data, PII adalah salah satu kategori data yang paling sensitif dan paling diatur secara hukum. Kalau perusahaan kamu menyimpan atau memproses PII pengguna, ada kewajiban hukum dan etis yang harus dipenuhi, mulai dari UU PDP Indonesia sampai regulasi internasional kalau kamu handle data dari luar negeri.

Risiko kebocoran PII bisa berdampak langsung ke individu: identitas bisa dicuri, rekening bisa dibobol, atau seseorang bisa jadi korban fraud.

PII dalam Pekerjaan Data

Sebagai data practitioner, kamu perlu tahu PII ada di mana dalam pipeline-mu. Beberapa pendekatan umum:

  • Pseudonymization: ganti nilai PII dengan token atau ID yang nggak meaningful (nama diganti dengan user_id)
  • Anonymization: hapus atau ubah data sedemikian rupa sehingga nggak bisa di-trace kembali ke individu
  • Data masking: sembunyikan sebagian nilai, misalnya menampilkan empat bintang diikuti empat digit terakhir untuk nomor kartu

Pemahaman tentang PII jadi landasan untuk banyak topik governance lain: Data Classification, Data Privacy, dan kepatuhan regulasi.

Lanjut Latihan

Udah paham PII? Lanjut latihan SQL dan Excel yuk!

Latihan interaktif, langsung di browser.

Mulai Latihan →