dbt
data build tool
Tool transformasi data open-source yang memungkinkan data engineer dan analyst menulis transformasi SQL layaknya software engineer, lengkap dengan testing, dokumentasi, dan version control.
dbt (data build tool) adalah framework transformasi data yang mengubah cara tim data bekerja dengan SQL. dbt menerapkan praktik rekayasa perangkat lunak—seperti modularitas, testing, dan dokumentasi—ke dalam workflow transformasi data.
dbt dalam Ekosistem ELT
dbt berfokus pada tahap T dalam ELT (Extract, Load, Transform):
- Extract & Load: Dilakukan oleh Fivetran, Airbyte, atau tool lain
- Transform: Inilah tugas dbt - mengubah raw data menjadi tabel analitik
Konsep Inti dbt
Model
File SQL (.sql) yang mendefinisikan satu transformasi. dbt mengeksekusi setiap model sebagai CREATE TABLE atau CREATE VIEW di data warehouse.
Ref Function
{{ ref('nama_model') }} - cara dbt mengelola dependensi antar model. dbt otomatis membangun DAG dan menjalankan model dalam urutan yang benar.
Test
Validasi otomatis terhadap data. dbt punya built-in tests: not_null, unique, accepted_values, relationships.
Documentation
Setiap model dan kolom bisa diberi deskripsi di file YAML. dbt generate dokumentasi HTML otomatis.
dbt Core vs dbt Cloud
| Aspek | dbt Core | dbt Cloud |
|---|---|---|
| Lisensi | Open source, gratis | SaaS berbayar |
| Interface | CLI | Web IDE + Scheduler |
| Scheduling | Harus pakai Airflow/dll | Built-in scheduler |
| Kolaborasi | Via Git | Built-in collaboration |
| Cocok untuk | Tim teknis | Tim campuran (analyst + engineer) |
Istilah Terkait
Apache Airflow
Cloud & Modern Data StackPlatform orkestrasi workflow open-source yang memungkinkan penjadwalan, monitoring, dan manajemen pipeline data kompleks menggunakan kode Python.
Airbyte
Cloud & Modern Data StackPlatform integrasi data open-source yang memudahkan pengiriman data dari ratusan sumber (database, API, SaaS) ke data warehouse atau data lake secara otomatis dengan pendekatan ELT.
Fivetran
Cloud & Modern Data StackPlatform ELT terkelola (managed) yang secara otomatis menyinkronisasi data dari ratusan sumber seperti database, SaaS, dan API ke data warehouse dengan zero maintenance.
Udah paham dbt? Lanjut latihan SQL dan Excel yuk!
Latihan interaktif, langsung di browser.