Model Deployment

Lanjutan

Proses memindahkan model machine learning yang sudah dilatih ke lingkungan production sehingga dapat digunakan oleh aplikasi nyata untuk menghasilkan prediksi.

Model Deployment adalah tahap akhir siklus hidup ML di mana model yang sudah dilatih dan dievaluasi diintegrasikan ke sistem production untuk melayani prediksi bagi pengguna atau sistem lain.

Strategi Deployment

Real-time Inference (Online Serving)

  • Model melayani satu permintaan secara sinkron
  • Latency: <100ms
  • Cocok untuk: rekomendasi real-time, fraud detection, chatbot
  • Platform: REST API (FastAPI, Flask), gRPC

Batch Inference (Offline Serving)

  • Model memproses banyak data sekaligus secara periodik
  • Latency: menit hingga jam
  • Cocok untuk: scoring bulanan, laporan prediktif, segmentasi
  • Platform: Spark, Airflow, scheduled Python jobs

Batch vs Real-time Inference

AspekBatch InferenceReal-time Inference
LatencyMenit - jamMilidetik
ThroughputSangat tinggiBergantung pada hardware
CostLebih rendahLebih tinggi
Use caseScoring batch, laporanRekomendasi, fraud, chatbot
KompleksitasSederhanaLebih kompleks (scaling, SLA)

Komponen Model Deployment

  1. Model artifact: File model (pickle, .pt, ONNX, TF SavedModel)
  2. Preprocessing: Pipeline yang identik dengan training
  3. API layer: Endpoint HTTP/gRPC untuk menerima request
  4. Serving infrastructure: Docker, Kubernetes, serverless
  5. Monitoring: Latency, error rate, data drift, prediction drift
Lanjut Latihan

Udah paham Model Deployment? Lanjut latihan SQL dan Excel yuk!

Latihan interaktif, langsung di browser.

Mulai Latihan →