Layanan data warehouse serverless dari Google Cloud yang memungkinkan analitik SQL pada dataset berskala petabyte dengan model bayar-per-query dan integrasi native dengan ekosistem Google Cloud.

Google BigQuery adalah fully managed, serverless data warehouse yang memungkinkan analitik super cepat pada dataset sangat besar menggunakan SQL. BigQuery tidak memerlukan provisioning server atau manajemen infrastruktur.

Arsitektur BigQuery

BigQuery memisahkan storage dan compute secara fundamental:

  • Colossus: Storage terdistribusi Google untuk data dalam format columnar (Capacitor)
  • Dremel: Query engine yang mendistribusikan query ke ribuan worker secara paralel
  • Jupiter: Jaringan internal Google berkecepatan petabit yang menghubungkan storage dan compute

Hasilnya: query dapat berjalan pada petabyte data dalam hitungan detik tanpa konfigurasi apapun.

Model Pricing BigQuery

ModelDeskripsiCocok untuk
On-demandBayar per TB data yang di-scan ($6.25/TB)Query tidak terduga, eksperimen
Capacity (slot reservations)Bayar per slot compute (per jam/detik)Workload rutin yang dapat diprediksi
BigQuery SandboxGratis sampai 10GB storage + 1TB query/bulanBelajar dan eksperimen

Fitur Unggulan BigQuery

Partitioning

Bagi tabel berdasarkan kolom tanggal atau kolom integer. Query yang filter berdasarkan partisi hanya scan partisi relevan - hemat biaya dan waktu.

Clustering

Urutkan data secara fisik berdasarkan kolom tertentu dalam setiap partisi. Mengurangi data yang di-scan saat ada filter pada kolom cluster.

BigQuery ML

Bangun dan jalankan model ML langsung dengan SQL di BigQuery - tanpa perlu export data.

Analytics Hub

Berbagi dataset secara terkelola dengan organisasi lain melalui data exchange.

Lanjut Latihan

Udah paham Google BigQuery? Lanjut latihan SQL dan Excel yuk!

Latihan interaktif, langsung di browser.

Mulai Latihan →