Question 1

Apa itu Idempotency?

Accepted Answer

Properti sebuah operasi di mana hasilnya selalu sama meski dijalankan berkali-kali. Kalau operasi kamu idempoten, kamu bisa retry tanpa takut data jadi kacau atau duplikat.

Question 2

Kapan Idempotency digunakan?

Accepted Answer

Data pipeline retry: Airflow task yang gagal bisa di-retry otomatis tanpa duplikat data di warehouse. Payment processing: charge pelanggan cuma sekali meski request dikirim berulang karena timeout jaringan. Webhook handling: event yang dikirim ulang oleh sistem nggak bikin record duplikat di database. CDC consumer: events yang diproses dua kali karena at-least-once delivery nggak bikin inkonsistensi data. ETL load harian: partisi data yang di-overwrite berulang tetap menghasilkan satu versi bersih

Question 3

Apa kesalahpahaman umum tentang Idempotency?

Accepted Answer

Idempotency cuma masalah backend developer - data engineer butuh ini juga. Kalau pipeline nggak idempoten, setiap gagal dan retry bisa bikin data dobel di warehouse yang susah diberesin. Operasi write nggak pernah bisa idempoten - write bisa didesain idempoten lewat UPSERT, conditional delete, partition overwrite, atau idempotency key. Kalau udah pakai idempotency key, operasi pasti aman selamanya - key harus disimpan dan dicek dengan benar. Kalau storage key-nya hilang misalnya Redis kena flush, perlindungan juga ikut hilang

Operasi	Idempoten?	Kenapa
SELECT *	Ya	Nggak ubah state apapun
INSERT (plain)	Nggak	Bisa buat record duplikat
INSERT ... ON CONFLICT DO NOTHING	Ya	Ada duplicate guard bawaan
UPDATE SET x = 5	Ya	Set ke nilai fixed, bukan relatif
UPDATE SET x = x + 1	Nggak	Setiap run nambah lagi
DELETE WHERE id = 123	Ya	Setelah pertama, nggak ada yang dihapus lagi
POST /api/order	Tergantung	Bisa buat order ganda tanpa idempotency key

Idempotency

Apa itu Idempotency?

Analogi Sehari-hari

Idempotency dalam Konteks Data

Idempotency Key

Kenapa Ini Penting di Data Pipeline?