Question 1

Apa itu Clustering?

Accepted Answer

Clustering adalah teknik machine learning untuk mengelompokkan data berdasarkan kemiripannya, tanpa label yang sudah ada sebelumnya. Cocok untuk segmentasi pelanggan, eksplorasi data, atau menemukan pola yang belum kamu sadari.

Question 2

Kapan Clustering digunakan?

Accepted Answer

Segmentasi pelanggan e-commerce Indonesia berdasarkan frekuensi belanja, nilai transaksi, dan kategori produk favorit. Pengelompokan outlet toko berdasarkan pola penjualan untuk targeting promosi yang lebih efisien. Analisis wilayah pemasaran: temukan daerah dengan karakteristik demand yang mirip untuk distribusi produk FMCG. Deteksi anomali transaksi: transaksi yang nggak masuk cluster manapun jadi kandidat investigasi fraud. Personalisasi konten: kelompokkan user berdasarkan perilaku browsing untuk rekomendasi yang lebih relevan

Question 3

Apa kesalahpahaman umum tentang Clustering?

Accepted Answer

Banyak yang kira cluster yang dihasilkan algoritma sudah punya makna. Nggak: algoritma cuma membagi data, analyst yang harus interpret dan beri nama tiap clusternya berdasarkan domain knowledge.. Clustering bukan classification tanpa label. Tujuannya berbeda: clustering untuk discovery dan eksplorasi, bukan untuk prediksi kelas yang sudah terdefinisi sebelumnya.. K-Means nggak cocok untuk semua bentuk cluster. Kalau cluster-mu bentuknya memanjang, tidak bulat, atau punya outlier banyak, DBSCAN atau algoritma lain lebih tepat dipakai.

Algoritma	Cara Kerja	Cocok Untuk
K-Means	Bagi data ke K kelompok berdasarkan jarak ke centroid	Data besar, bentuk cluster bulat
DBSCAN	Cluster berdasarkan kepadatan data	Cluster bentuk aneh, ada noise atau outlier
Hierarchical Clustering	Bangun pohon dendrogram dari bawah ke atas	Eksplorasi, menentukan jumlah cluster
Gaussian Mixture Model	Probabilistik, data point bisa masuk beberapa cluster	Data overlap antar cluster

Aspek	Clustering	Classification
Label	Tidak butuh label	Butuh data berlabel
Tipe learning	Unsupervised	Supervised
Output	Kelompok tanpa nama	Kategori yang sudah terdefinisi
Tujuan	Eksplorasi, discovery	Prediksi, automation
Contoh	Segmentasi pelanggan baru	Prediksi churn pelanggan

Clustering

Apa itu Clustering?

Analogi: Sorting Buku Tanpa Panduan

Algoritma Clustering Populer

Gimana Cara Menentukan Jumlah Cluster?

Clustering vs. Classification

Interpretasi Hasil Cluster