Stream Processing

Menengah

Pemrosesan data secara real-time saat data masuk - setiap event diproses dalam milidetik hingga detik, tanpa menunggu data dikumpulkan dalam batch.

Stream Processing adalah paradigma pemrosesan data di mana data diproses secara kontinyu dan real-time saat data masuk, berbeda dari Batch Processing yang mengumpulkan data dulu baru diproses.

Stream Processing vs Batch Processing

AspekStream ProcessingBatch Processing
LatencyMilidetik - detikMenit - jam
Data modelEvents / unboundedFiles / bounded dataset
KompleksitasTinggiLebih sederhana
BiayaLebih mahalLebih murah
Fault toleranceButuh perhatian ekstraLebih mudah
Use caseFraud, alerting, live dashboardETL, reporting

Konsep Kunci Stream Processing

Event

Unit data terkecil yang diproses - satu transaksi, satu klik, satu sensor reading.

Stream

Aliran events yang tidak terbatas (unbounded) dan terus mengalir.

Window

Cara membatasi stream menjadi potongan yang bisa diproses:

  • Tumbling window: interval tetap, tidak overlap (mis: per menit)
  • Sliding window: interval yang bergerak (mis: 5 menit terakhir setiap detik)
  • Session window: berdasarkan aktivitas user

Stateful vs Stateless

  • Stateless: setiap event diproses independen
  • Stateful: hasil bergantung pada event sebelumnya (contoh: running total)
Lanjut Latihan

Udah paham Stream Processing? Lanjut latihan SQL dan Excel yuk!

Latihan interaktif, langsung di browser.

Mulai Latihan →