ETL

Extract Transform Load

Pemula

Proses integrasi data yang terdiri dari Extract (mengambil data), Transform (membersihkan dan mengubah format), dan Load (memasukkan ke sistem tujuan).

ETL adalah singkatan dari Extract, Transform, Load - sebuah proses untuk memindahkan data dari sumber ke sistem tujuan seperti Data Warehouse.

Tiga Tahap ETL

1. Extract (Ekstraksi)

Mengambil data dari berbagai sumber:

  • Database (MySQL, PostgreSQL, Oracle)
  • File (CSV, JSON, XML)
  • API dan web services
  • Cloud applications (Salesforce, HubSpot)

2. Transform (Transformasi)

Membersihkan dan mengubah data:

  • Data cleansing (hapus duplikat, fix format)
  • Data validation (cek tipe data, constraints)
  • Aggregation (summarize data)
  • Joining data dari multiple sources
  • Business logic application

3. Load (Loading)

Memasukkan data ke sistem tujuan:

  • Data Warehouse
  • Data Lake
  • Data Mart
  • Reporting database

ETL vs ELT

AspekETLELT
TransformDi staging areaDi target system
KecepatanLebih lambatLebih cepat
Cocok untukOn-premise warehouseCloud warehouse
Contoh ToolInformatica, SSISdbt, Snowflake
Lanjut Latihan

Udah paham ETL? Lanjut latihan SQL dan Excel yuk!

Latihan interaktif, langsung di browser.

Mulai Latihan →