Question 1

Apa itu Apache Kafka?

Accepted Answer

Platform event streaming terdistribusi yang memungkinkan pengiriman, penyimpanan, dan pemrosesan aliran data (stream) real-time dalam skala besar dengan throughput tinggi dan latensi rendah.

Question 2

Kapan Apache Kafka digunakan?

Accepted Answer

Real-time analytics - streaming event user behavior ke data warehouse secara real-time. Log aggregation - mengumpulkan log dari ratusan service ke satu tempat. Event sourcing - menyimpan semua perubahan state aplikasi sebagai event yang immutable. Microservice communication - decoupling antar service dengan async messaging. CDC (Change Data Capture) - menangkap perubahan database dan stream ke consumer downstream

Question 3

Apa kesalahpahaman umum tentang Apache Kafka?

Accepted Answer

Kafka bukan message queue biasa - Kafka adalah event log yang persistent, pesan tidak hilang setelah dibaca. Kafka tidak cocok untuk semua use case - untuk simple task queue, RabbitMQ lebih mudah dioperasikan. Lebih banyak partition tidak selalu lebih baik - terlalu banyak partition menambah overhead koordinasi di broker

Aspek	Apache Kafka	RabbitMQ / ActiveMQ
Model	Event log (persistent)	Message queue (hapus setelah dibaca)
Retensi	Dapat menyimpan hari/minggu	Biasanya hapus setelah consumed
Konsumer	Banyak consumer independen	Pesan hanya dibaca satu consumer
Throughput	Jutaan msg/detik	Ribuan msg/detik
Use case	Event streaming, log aggregation	Task queue, RPC

Apache Kafka

Konsep Inti Kafka

Topic

Partition

Producer

Consumer

Consumer Group

Broker

Kafka vs Message Queue Tradisional

Arsitektur Kafka

Istilah Terkait

Stream Processing

Apache Spark