Question 1

Apa itu Model Deployment?

Accepted Answer

Proses memindahkan model machine learning yang sudah dilatih ke lingkungan production sehingga dapat digunakan oleh aplikasi nyata untuk menghasilkan prediksi.

Question 2

Kapan Model Deployment digunakan?

Accepted Answer

REST API endpoint untuk scoring churn secara real-time saat pelanggan login. Batch scoring seluruh database pelanggan setiap malam untuk segmentasi kampanye. Embedding model dalam aplikasi mobile untuk inferensi offline (on-device ML). Canary deployment model baru untuk 5% traffic sebelum full rollout. A/B testing dua versi model untuk memilih yang lebih akurat di production

Question 3

Apa kesalahpahaman umum tentang Model Deployment?

Accepted Answer

Model deployment bukan akhir dari siklus ML - monitoring dan retraining berkala sama pentingnya dengan deployment awal. Performa tinggi di training tidak menjamin performa di production - distribusi data produksi bisa berbeda dari data training. Deployment model tidak harus kompleks - untuk skala kecil, FastAPI + Docker sudah sangat memadai sebelum membutuhkan Kubernetes

Aspek	Batch Inference	Real-time Inference
Latency	Menit - jam	Milidetik
Throughput	Sangat tinggi	Bergantung pada hardware
Cost	Lebih rendah	Lebih tinggi
Use case	Scoring batch, laporan	Rekomendasi, fraud, chatbot
Kompleksitas	Sederhana	Lebih kompleks (scaling, SLA)

Model Deployment

Strategi Deployment

Real-time Inference (Online Serving)

Batch Inference (Offline Serving)

Batch vs Real-time Inference

Komponen Model Deployment

Istilah Terkait

Feature Engineering

MLOps

Model Training