Data Lakehouse
Arsitektur data modern yang menggabungkan fleksibilitas Data Lake (menyimpan semua tipe data) dengan kemampuan analitik Data Warehouse (ACID, performa query tinggi).
Data Lakehouse adalah arsitektur penyimpanan data generasi berikutnya yang menggabungkan keunggulan Data Lake (fleksibilitas, biaya rendah) dengan kemampuan Data Warehouse (ACID transactions, performa query, schema enforcement).
Data Lakehouse vs Pendahulunya
| Aspek | Data Lake | Data Warehouse | Data Lakehouse |
|---|---|---|---|
| Format data | Semua tipe | Terstruktur | Semua tipe |
| ACID | Tidak | Ya | Ya |
| Schema | On-read | On-write | Opsional (on-read/write) |
| Query speed | Lambat | Cepat | Cepat |
| ML support | Baik | Terbatas | Sangat baik |
| Biaya storage | Murah | Mahal | Murah |
Komponen Utama Lakehouse
- Open file format: Delta Lake, Apache Iceberg, Apache Hudi
- Metadata layer: Tracking schema, versioning, ACID transactions
- Query engine: Spark, Trino, DuckDB yang membaca format ini
- Catalog: Mencatat semua tabel dan metadata
Fitur Unggulan
- Time travel: Query data di masa lalu (mis: "data 7 hari lalu")
- ACID transactions: Tidak ada partial writes atau dirty reads
- Schema evolution: Tambah kolom tanpa menghapus data lama
- Unified storage: Satu storage untuk BI dan ML
Istilah Terkait
Data Warehouse
Database & StorageSistem penyimpanan data terpusat yang dirancang khusus untuk analisis dan pelaporan bisnis, mengintegrasikan data dari berbagai sumber.
Data Lake
Database & StorageRepositori penyimpanan terpusat yang menyimpan data dalam format mentah (raw) dari berbagai sumber, baik terstruktur maupun tidak terstruktur.
Database
Database & StorageKumpulan data terorganisir yang disimpan secara elektronik dan dapat diakses, dikelola, serta diperbarui dengan mudah.
Data Mart
Database & StorageSubset dari Data Warehouse yang difokuskan untuk kebutuhan analitik satu departemen atau fungsi bisnis tertentu, seperti Sales Mart atau Finance Mart.
Udah paham Data Lakehouse? Lanjut latihan SQL dan Excel yuk!
Latihan interaktif, langsung di browser.