Feature Store
Repositori terpusat untuk menyimpan, mengelola, dan melayani fitur machine learning yang dapat digunakan bersama oleh berbagai model dan tim data science.
Feature Store adalah lapisan infrastruktur yang berfungsi sebagai repositori terpusat untuk fitur machine learning - mengatasi masalah duplikasi, inkonsistensi, dan kesulitan sharing fitur antara tim dan antara training dan serving.
Masalah yang Dipecahkan Feature Store
Tanpa Feature Store, tim ML sering menghadapi:
- Setiap tim menghitung fitur yang sama secara independen → duplikasi kerja
- Fitur training dihitung berbeda dari fitur serving → training-serving skew
- Tidak ada katalog fitur → tidak tahu fitur mana yang sudah ada
- Fitur sulit di-reuse antar model → lambat iterasi
Online vs Offline Feature Store
| Aspek | Offline Feature Store | Online Feature Store |
|---|---|---|
| Storage | Data Warehouse / Data Lake | Low-latency store (Redis, DynamoDB) |
| Latency | Menit - jam | Milidetik |
| Throughput | Sangat tinggi (batch) | Ribuan QPS |
| Penggunaan | Training model | Real-time inference |
| Contoh data | Fitur historis 12 bulan | Fitur paling baru pelanggan |
Arsitektur Feature Store
Alur data dalam Feature Store:
- Sumber Data (DB, Event Stream)
- Feature Computation (dbt, Spark, Python)
- Feature Store (Feast, Tecton, Vertex AI)
- Offline Store → untuk training model
- Online Store → untuk serving real-time (<10ms)
Fitur yang Baik untuk Feature Store
- Reusable: dapat digunakan oleh lebih dari satu model
- Stable: tidak berubah definisi terlalu sering
- Documented: ada deskripsi, owner, dan SLA
- Versioned: perubahan fitur dapat dilacak
Lanjut Latihan
Mulai Latihan →Udah paham Feature Store? Lanjut latihan SQL dan Excel yuk!
Latihan interaktif, langsung di browser.