Feature Store

Lanjutan

Repositori terpusat untuk menyimpan, mengelola, dan melayani fitur machine learning yang dapat digunakan bersama oleh berbagai model dan tim data science.

Feature Store adalah lapisan infrastruktur yang berfungsi sebagai repositori terpusat untuk fitur machine learning - mengatasi masalah duplikasi, inkonsistensi, dan kesulitan sharing fitur antara tim dan antara training dan serving.

Masalah yang Dipecahkan Feature Store

Tanpa Feature Store, tim ML sering menghadapi:

  • Setiap tim menghitung fitur yang sama secara independen → duplikasi kerja
  • Fitur training dihitung berbeda dari fitur serving → training-serving skew
  • Tidak ada katalog fitur → tidak tahu fitur mana yang sudah ada
  • Fitur sulit di-reuse antar model → lambat iterasi

Online vs Offline Feature Store

AspekOffline Feature StoreOnline Feature Store
StorageData Warehouse / Data LakeLow-latency store (Redis, DynamoDB)
LatencyMenit - jamMilidetik
ThroughputSangat tinggi (batch)Ribuan QPS
PenggunaanTraining modelReal-time inference
Contoh dataFitur historis 12 bulanFitur paling baru pelanggan

Arsitektur Feature Store

Alur data dalam Feature Store:

  1. Sumber Data (DB, Event Stream)
  2. Feature Computation (dbt, Spark, Python)
  3. Feature Store (Feast, Tecton, Vertex AI)
    • Offline Store → untuk training model
    • Online Store → untuk serving real-time (<10ms)

Fitur yang Baik untuk Feature Store

  • Reusable: dapat digunakan oleh lebih dari satu model
  • Stable: tidak berubah definisi terlalu sering
  • Documented: ada deskripsi, owner, dan SLA
  • Versioned: perubahan fitur dapat dilacak
Lanjut Latihan

Udah paham Feature Store? Lanjut latihan SQL dan Excel yuk!

Latihan interaktif, langsung di browser.

Mulai Latihan →