Unsupervised Learning

Menengah

Jenis machine learning di mana model menemukan pola, struktur, dan kelompok tersembunyi dari data tanpa menggunakan label atau jawaban yang telah ditentukan sebelumnya.

Unsupervised Learning adalah paradigma machine learning di mana tidak ada label yang diberikan - model harus sendiri menemukan struktur dan pola yang bermakna dari data input.

Dua Kategori Utama Unsupervised Learning

Clustering

Mengelompokkan data berdasarkan kemiripan:

  • K-Means: Partisi ke K cluster berdasarkan centroid
  • DBSCAN: Berbasis densitas, otomatis menemukan jumlah cluster
  • Hierarchical: Membentuk hierarki cluster (dendrogram)
  • Use case: segmentasi pelanggan, grouping artikel

Dimensionality Reduction

Mereduksi jumlah fitur sambil mempertahankan informasi penting:

  • PCA: Linear projection ke komponen utama
  • t-SNE: Visualisasi 2D/3D untuk data berdimensi tinggi
  • UMAP: Lebih cepat dari t-SNE, mempertahankan struktur global
  • Use case: visualisasi embedding, preprocessing sebelum supervised learning

Supervised vs Unsupervised

AspekSupervisedUnsupervised
LabelDiperlukanTidak diperlukan
TujuanPrediksiEksplorasi, pattern discovery
EvaluasiObjektif (accuracy, F1)Subjektif (silhouette, domain expert)
ContohKlasifikasi churnSegmentasi pelanggan
TantanganLabeling mahalInterpretasi hasil
Lanjut Latihan

Udah paham Unsupervised Learning? Lanjut latihan SQL dan Excel yuk!

Latihan interaktif, langsung di browser.

Mulai Latihan →