Platform integrasi data open-source yang memudahkan pengiriman data dari ratusan sumber (database, API, SaaS) ke data warehouse atau data lake secara otomatis dengan pendekatan ELT.

Airbyte adalah platform data integration open-source yang memungkinkan tim data memindahkan data dari berbagai sumber ke destination (data warehouse, data lake) tanpa menulis kode.

Konsep Inti Airbyte

Source

Sumber data yang akan diambil: database (PostgreSQL, MySQL, MongoDB), SaaS (Salesforce, HubSpot, Stripe), file (S3, SFTP), atau API custom.

Destination

Tempat data dikirim: Snowflake, BigQuery, Redshift, Delta Lake, PostgreSQL, S3, dll.

Connection

Konfigurasi sinkronisasi dari satu source ke satu destination. Termasuk jadwal sync, mode sync, dan mapping field.

Sync Mode

Cara data disinkronisasi:

  • Full Refresh / Overwrite: Hapus semua data lama, isi ulang dari awal
  • Full Refresh / Append: Tambahkan snapshot baru tanpa hapus yang lama
  • Incremental / Append: Hanya ambil data baru sejak sync terakhir
  • Incremental / Deduped: Hanya data baru, plus de-duplikasi berdasarkan primary key

Airbyte vs Fivetran

AspekAirbyteFivetran
LisensiOpen source (+ cloud)SaaS berbayar
BiayaGratis self-hostRelatif mahal (per row)
Connector jumlah350+300+
Custom connectorMudah (Python/Java SDK)Terbatas
Managed optionAirbyte CloudYa (fully managed)
SetupButuh infra (Docker)Tidak perlu setup
Lanjut Latihan

Udah paham Airbyte? Lanjut latihan SQL dan Excel yuk!

Latihan interaktif, langsung di browser.

Mulai Latihan →