Layanan cloud data warehouse terkelola dari AWS yang menggunakan penyimpanan kolumnar untuk analitik cepat pada dataset berskala petabyte, terintegrasi penuh dengan ekosistem AWS.

Amazon Redshift adalah fully managed cloud data warehouse yang dioptimalkan untuk analitik data berskala besar. Redshift menggunakan arsitektur columnar storage dan Massively Parallel Processing (MPP) untuk menjalankan query analitik secara cepat.

Arsitektur Redshift

Cluster-based (Traditional)

  • Leader Node: Menerima query, membuat rencana eksekusi, mendistribusikan task
  • Compute Nodes: Mengeksekusi query secara paralel, menyimpan data
  • Node Slices: Setiap compute node dibagi menjadi slice, masing-masing punya storage dan CPU sendiri

Redshift Serverless (Modern)

Redshift tanpa provisioning cluster - AWS otomatis mengelola kapasitas sesuai workload.

Fitur Khusus Redshift

Distribution Style

Menentukan bagaimana data didistribusikan ke compute nodes:

  • AUTO: Redshift pilih sendiri berdasarkan ukuran tabel
  • ALL: Replika ke semua node (untuk tabel dimensi kecil)
  • EVEN: Distribusi round-robin merata
  • KEY: Distribusi berdasarkan nilai kolom tertentu

Sort Key

Kolom yang digunakan untuk sorting fisik data pada disk. Query dengan filter pada sort key jauh lebih cepat karena Redshift bisa skip block data yang tidak relevan.

Redshift vs Snowflake vs BigQuery

AspekAmazon RedshiftSnowflakeGoogle BigQuery
PengelolaanCluster/ServerlessServerlessServerless
PricingPer node-hour / serverlessCompute + storagePay-per-query
Multi-cloudAWS onlyAWS, Azure, GCPGCP only
IntegrationEkosistem AWSMulti-cloudGCP + connectors
ScalingManual atau auto (serverless)Instan, per virtual WHOtomatis
Lanjut Latihan

Udah paham Amazon Redshift? Lanjut latihan SQL dan Excel yuk!

Latihan interaktif, langsung di browser.

Mulai Latihan →