Amazon Redshift
Layanan cloud data warehouse terkelola dari AWS yang menggunakan penyimpanan kolumnar untuk analitik cepat pada dataset berskala petabyte, terintegrasi penuh dengan ekosistem AWS.
Amazon Redshift adalah fully managed cloud data warehouse yang dioptimalkan untuk analitik data berskala besar. Redshift menggunakan arsitektur columnar storage dan Massively Parallel Processing (MPP) untuk menjalankan query analitik secara cepat.
Arsitektur Redshift
Cluster-based (Traditional)
- Leader Node: Menerima query, membuat rencana eksekusi, mendistribusikan task
- Compute Nodes: Mengeksekusi query secara paralel, menyimpan data
- Node Slices: Setiap compute node dibagi menjadi slice, masing-masing punya storage dan CPU sendiri
Redshift Serverless (Modern)
Redshift tanpa provisioning cluster - AWS otomatis mengelola kapasitas sesuai workload.
Fitur Khusus Redshift
Distribution Style
Menentukan bagaimana data didistribusikan ke compute nodes:
- AUTO: Redshift pilih sendiri berdasarkan ukuran tabel
- ALL: Replika ke semua node (untuk tabel dimensi kecil)
- EVEN: Distribusi round-robin merata
- KEY: Distribusi berdasarkan nilai kolom tertentu
Sort Key
Kolom yang digunakan untuk sorting fisik data pada disk. Query dengan filter pada sort key jauh lebih cepat karena Redshift bisa skip block data yang tidak relevan.
Redshift vs Snowflake vs BigQuery
| Aspek | Amazon Redshift | Snowflake | Google BigQuery |
|---|---|---|---|
| Pengelolaan | Cluster/Serverless | Serverless | Serverless |
| Pricing | Per node-hour / serverless | Compute + storage | Pay-per-query |
| Multi-cloud | AWS only | AWS, Azure, GCP | GCP only |
| Integration | Ekosistem AWS | Multi-cloud | GCP + connectors |
| Scaling | Manual atau auto (serverless) | Instan, per virtual WH | Otomatis |
Udah paham Amazon Redshift? Lanjut latihan SQL dan Excel yuk!
Latihan interaktif, langsung di browser.