Batch Processing
Pemrosesan data dalam kumpulan besar (batch) pada waktu tertentu - biasanya terjadwal malam atau minggu - bukan secara real-time saat data masuk.
Batch Processing adalah metode pemrosesan data di mana data dikumpulkan terlebih dahulu dalam periode tertentu, lalu diproses sekaligus dalam satu "batch" pada waktu yang telah ditentukan.
Batch Processing vs Stream Processing
| Aspek | Batch Processing | Stream Processing |
|---|---|---|
| Timing | Terjadwal (nightly, hourly) | Real-time / milidetik |
| Latency | Tinggi (menit - jam) | Rendah (milidetik - detik) |
| Throughput | Sangat tinggi | Sedang |
| Kompleksitas | Rendah | Tinggi |
| Biaya | Lebih murah | Lebih mahal |
| Use case | ETL, reporting | Fraud detection, alerting |
Kapan Gunakan Batch?
Batch cocok ketika:
- Data tidak butuh real-time: laporan harian, weekly summary
- Volume sangat besar: memproses jutaan record sekaligus lebih efisien
- Kompute intensif: model ML training, complex transformations
- Cost sensitive: batch lebih murah dari streaming
Contoh Skenario Batch
- Nightly ETL: load data produksi ke Data Warehouse setiap tengah malam
- Weekly report: generate laporan keuangan setiap Senin pagi
- Monthly billing: hitung tagihan semua customer di akhir bulan
- ML model retraining: retrain model prediksi setiap minggu
Istilah Terkait
Data Pipeline
Data ProcessingSerangkaian proses otomatis yang memindahkan dan mengubah data dari sumber ke tujuan secara terstruktur dan terjadwal.
Stream Processing
Data ProcessingPemrosesan data secara real-time saat data masuk - setiap event diproses dalam milidetik hingga detik, tanpa menunggu data dikumpulkan dalam batch.
Lanjut Latihan
Mulai Latihan →Udah paham Batch Processing? Lanjut latihan SQL dan Excel yuk!
Latihan interaktif, langsung di browser.