Cloud Data Warehouse
Database khusus untuk analisis skala besar yang dijalankan di cloud: nggak perlu setup server fisik, bayar sesuai pemakaian, dan bisa handle data ratusan juta baris dengan cepat.
Apa itu Cloud Data Warehouse?
Cloud Data Warehouse (CDW) adalah sistem penyimpanan dan query data yang dirancang khusus untuk analisis, dikelola oleh provider cloud. Kamu nggak perlu beli, setup, atau maintain hardware sendiri. Provider yang ngurusin semuanya, kamu tinggal connect, upload data, dan query.
Bedanya sama database biasa: CDW dioptimalkan untuk query analitik yang baca jutaan-miliaran baris, bukan untuk transaksi satu-satu kayak aplikasi.
Bayangkan database transaksional (kayak PostgreSQL di backend aplikasimu) sebagai kasir toko: cepat proses satu transaksi, tapi kerepotan kalau harus hitung ulang semua transaksi setahun terakhir. Cloud Data Warehouse adalah bagian akuntansi: lambat untuk transaksi satuan, tapi super cepat untuk agregasi data besar.
Perbandingan Platform CDW Utama
| Platform | Provider | Keunggulan | Cocok untuk |
|---|---|---|---|
| BigQuery | Google Cloud | Serverless, pay-per-query | Tim yang udah di ekosistem Google |
| Snowflake | Snowflake Inc. | Multi-cloud, separation compute/storage | Enterprise multi-cloud |
| Redshift | Amazon AWS | Terintegrasi ekosistem AWS | Tim yang heavy di AWS |
| Databricks SQL | Databricks | Lakehouse, kuat untuk ML + SQL | Tim yang butuh ML dan SQL bareng |
OLAP vs OLTP: Kenapa CDW Beda?
CDW pakai arsitektur OLAP (Online Analytical Processing), sedangkan database aplikasi biasa pakai OLTP (Online Transaction Processing).
| Aspek | OLTP | OLAP (CDW) |
|---|---|---|
| Optimasi untuk | Banyak transaksi kecil | Sedikit query besar |
| Storage format | Row-based | Column-based |
| Contoh | PostgreSQL, MySQL | BigQuery, Snowflake |
| Query tipikal | INSERT, UPDATE per baris | SELECT dengan banyak aggregasi |
| Ukuran data | Gigabytes | Terabytes sampai petabytes |
Column-based storage inilah yang bikin CDW cepat: kalau kamu query 'total revenue per bulan', CDW cuma perlu baca kolom revenue dan tanggal, nggak perlu baca seluruh baris data.
Model Biaya CDW
| Model | Cara Hitung | Contoh |
|---|---|---|
| Pay-per-query | Bayar berdasarkan data yang di-scan | BigQuery (default) |
| Pay-per-compute | Bayar berdasarkan waktu compute aktif | Snowflake Virtual Warehouse |
| Reserved capacity | Komit kapasitas untuk harga lebih murah | Redshift Reserved Instances |
Buat pemula, BigQuery sandbox free untuk 1 TB query per bulan. Cocok banget untuk belajar dan eksperimen sebelum commit ke paket berbayar.
Kenapa Pindah ke CDW?
Kalau tim kamu masih analisis data di Excel atau Google Sheets dengan file ratusan MB yang sering crash, CDW adalah upgrade yang worth it. Kamu bisa query 100 juta baris dalam hitungan detik, share akses ke banyak orang, dan connect langsung ke BI tools.
Udah paham Cloud Data Warehouse? Lanjut latihan SQL dan Excel yuk!
Latihan interaktif, langsung di browser.