Batch Processing

Pemula

Pemrosesan data dalam kumpulan besar (batch) pada waktu tertentu - biasanya terjadwal malam atau minggu - bukan secara real-time saat data masuk.

Batch Processing adalah metode pemrosesan data di mana data dikumpulkan terlebih dahulu dalam periode tertentu, lalu diproses sekaligus dalam satu "batch" pada waktu yang telah ditentukan.

Batch Processing vs Stream Processing

AspekBatch ProcessingStream Processing
TimingTerjadwal (nightly, hourly)Real-time / milidetik
LatencyTinggi (menit - jam)Rendah (milidetik - detik)
ThroughputSangat tinggiSedang
KompleksitasRendahTinggi
BiayaLebih murahLebih mahal
Use caseETL, reportingFraud detection, alerting

Kapan Gunakan Batch?

Batch cocok ketika:

  1. Data tidak butuh real-time: laporan harian, weekly summary
  2. Volume sangat besar: memproses jutaan record sekaligus lebih efisien
  3. Kompute intensif: model ML training, complex transformations
  4. Cost sensitive: batch lebih murah dari streaming

Contoh Skenario Batch

  • Nightly ETL: load data produksi ke Data Warehouse setiap tengah malam
  • Weekly report: generate laporan keuangan setiap Senin pagi
  • Monthly billing: hitung tagihan semua customer di akhir bulan
  • ML model retraining: retrain model prediksi setiap minggu
Lanjut Latihan

Udah paham Batch Processing? Lanjut latihan SQL dan Excel yuk!

Latihan interaktif, langsung di browser.

Mulai Latihan →