Data Lakehouse

Menengah

Arsitektur data modern yang menggabungkan fleksibilitas Data Lake (menyimpan semua tipe data) dengan kemampuan analitik Data Warehouse (ACID, performa query tinggi).

Data Lakehouse adalah arsitektur penyimpanan data generasi berikutnya yang menggabungkan keunggulan Data Lake (fleksibilitas, biaya rendah) dengan kemampuan Data Warehouse (ACID transactions, performa query, schema enforcement).

Data Lakehouse vs Pendahulunya

AspekData LakeData WarehouseData Lakehouse
Format dataSemua tipeTerstrukturSemua tipe
ACIDTidakYaYa
SchemaOn-readOn-writeOpsional (on-read/write)
Query speedLambatCepatCepat
ML supportBaikTerbatasSangat baik
Biaya storageMurahMahalMurah

Komponen Utama Lakehouse

  1. Open file format: Delta Lake, Apache Iceberg, Apache Hudi
  2. Metadata layer: Tracking schema, versioning, ACID transactions
  3. Query engine: Spark, Trino, DuckDB yang membaca format ini
  4. Catalog: Mencatat semua tabel dan metadata

Fitur Unggulan

  • Time travel: Query data di masa lalu (mis: "data 7 hari lalu")
  • ACID transactions: Tidak ada partial writes atau dirty reads
  • Schema evolution: Tambah kolom tanpa menghapus data lama
  • Unified storage: Satu storage untuk BI dan ML
Lanjut Latihan

Udah paham Data Lakehouse? Lanjut latihan SQL dan Excel yuk!

Latihan interaktif, langsung di browser.

Mulai Latihan →