ETL
Extract Transform Load
Proses integrasi data yang terdiri dari Extract (mengambil data), Transform (membersihkan dan mengubah format), dan Load (memasukkan ke sistem tujuan).
ETL adalah singkatan dari Extract, Transform, Load - sebuah proses untuk memindahkan data dari sumber ke sistem tujuan seperti Data Warehouse.
Tiga Tahap ETL
1. Extract (Ekstraksi)
Mengambil data dari berbagai sumber:
- Database (MySQL, PostgreSQL, Oracle)
- File (CSV, JSON, XML)
- API dan web services
- Cloud applications (Salesforce, HubSpot)
2. Transform (Transformasi)
Membersihkan dan mengubah data:
- Data cleansing (hapus duplikat, fix format)
- Data validation (cek tipe data, constraints)
- Aggregation (summarize data)
- Joining data dari multiple sources
- Business logic application
3. Load (Loading)
Memasukkan data ke sistem tujuan:
- Data Warehouse
- Data Lake
- Data Mart
- Reporting database
ETL vs ELT
| Aspek | ETL | ELT |
|---|---|---|
| Transform | Di staging area | Di target system |
| Kecepatan | Lebih lambat | Lebih cepat |
| Cocok untuk | On-premise warehouse | Cloud warehouse |
| Contoh Tool | Informatica, SSIS | dbt, Snowflake |
Istilah Terkait
Data Pipeline
Data ProcessingSerangkaian proses otomatis yang memindahkan dan mengubah data dari sumber ke tujuan secara terstruktur dan terjadwal.
ELT
Data ProcessingVarian modern ETL di mana data diekstrak dan langsung dimuat ke tujuan, baru kemudian ditransformasi menggunakan kekuatan komputasi cloud data warehouse.
CDC
Data ProcessingTeknik real-time untuk mendeteksi dan merekam perubahan data di database sumber (INSERT, UPDATE, DELETE) untuk disinkronkan ke sistem tujuan.
Udah paham ETL? Lanjut latihan SQL dan Excel yuk!
Latihan interaktif, langsung di browser.