Question 1

Apa itu Classification?

Accepted Answer

Classification adalah teknik machine learning untuk memprediksi kategori atau kelas dari suatu data - misalnya spam atau bukan spam, churn atau tidak, kategori produk apa. Outputnya adalah label, bukan angka.

Question 2

Kapan Classification digunakan?

Accepted Answer

Prediksi churn pelanggan operator telekomunikasi Indonesia berdasarkan pola penggunaan bulanan. Deteksi transaksi fraud di fintech atau perbankan digital secara real-time. Klasifikasi keluhan pelanggan ke kategori yang tepat (billing, teknis, pengiriman) untuk routing otomatis. Filter konten ujaran kebencian di platform media sosial lokal sebelum tayang. Scoring credit risk untuk aplikasi pinjaman online (P2P lending) berdasarkan profil peminjam

Question 3

Apa kesalahpahaman umum tentang Classification?

Accepted Answer

Accuracy tinggi nggak berarti model bagus, terutama untuk data yang imbalanced. 95% accuracy bisa jadi model yang nggak pernah prediksi kelas minoritas sama sekali.. Logistic Regression itu Classification, bukan Regression. Namanya memang membingungkan, tapi outputnya adalah probabilitas kelas, bukan nilai kontinu.. Makin kompleks modelnya nggak selalu lebih baik. Di banyak kasus bisnis, Decision Tree sederhana yang bisa dijelaskan ke stakeholder lebih valuable dari neural network yang performanya cuma sedikit lebih tinggi.

Algoritma	Kapan Cocok	Kelebihan
Logistic Regression	Binary, data linier, butuh interpretasi	Cepat, interpretable
Decision Tree	Perlu penjelasan ke stakeholder	Mudah divisualisasikan
Random Forest	Data tabular, performa baik	Robust, nggak gampang overfitting
XGBoost	Kompetisi, performa maksimal	State-of-the-art untuk tabular data
SVM	Data dimensi tinggi	Bagus untuk teks
Neural Network	Data kompleks, gambar, teks	Sangat fleksibel

Classification

Apa itu Classification?

Binary vs. Multi-class Classification

Algoritma Classification Populer

Cara Evaluasi Model Classification

Masalah Imbalanced Data

Kapan Data Analyst Butuh Classification?