Google BigQuery
Layanan data warehouse serverless dari Google Cloud yang memungkinkan analitik SQL pada dataset berskala petabyte dengan model bayar-per-query dan integrasi native dengan ekosistem Google Cloud.
Google BigQuery adalah fully managed, serverless data warehouse yang memungkinkan analitik super cepat pada dataset sangat besar menggunakan SQL. BigQuery tidak memerlukan provisioning server atau manajemen infrastruktur.
Arsitektur BigQuery
BigQuery memisahkan storage dan compute secara fundamental:
- Colossus: Storage terdistribusi Google untuk data dalam format columnar (Capacitor)
- Dremel: Query engine yang mendistribusikan query ke ribuan worker secara paralel
- Jupiter: Jaringan internal Google berkecepatan petabit yang menghubungkan storage dan compute
Hasilnya: query dapat berjalan pada petabyte data dalam hitungan detik tanpa konfigurasi apapun.
Model Pricing BigQuery
| Model | Deskripsi | Cocok untuk |
|---|---|---|
| On-demand | Bayar per TB data yang di-scan ($6.25/TB) | Query tidak terduga, eksperimen |
| Capacity (slot reservations) | Bayar per slot compute (per jam/detik) | Workload rutin yang dapat diprediksi |
| BigQuery Sandbox | Gratis sampai 10GB storage + 1TB query/bulan | Belajar dan eksperimen |
Fitur Unggulan BigQuery
Partitioning
Bagi tabel berdasarkan kolom tanggal atau kolom integer. Query yang filter berdasarkan partisi hanya scan partisi relevan - hemat biaya dan waktu.
Clustering
Urutkan data secara fisik berdasarkan kolom tertentu dalam setiap partisi. Mengurangi data yang di-scan saat ada filter pada kolom cluster.
BigQuery ML
Bangun dan jalankan model ML langsung dengan SQL di BigQuery - tanpa perlu export data.
Analytics Hub
Berbagi dataset secara terkelola dengan organisasi lain melalui data exchange.
Udah paham Google BigQuery? Lanjut latihan SQL dan Excel yuk!
Latihan interaktif, langsung di browser.