Question 1

Apa itu Embedding?

Accepted Answer

Embedding adalah representasi teks, gambar, atau data lain sebagai deretan angka (vector) yang menangkap makna semantiknya. Dengan embedding, komputer bisa 'mengerti' bahwa 'kucing' dan 'kitty' punya makna yang dekat, meski kata-katanya beda.

Question 2

Kapan Embedding digunakan?

Accepted Answer

Semantic search untuk knowledge base internal perusahaan asuransi di Indonesia. Sistem rekomendasi produk di marketplace berdasarkan kesamaan deskripsi dan ulasan pelanggan. Deteksi duplikasi konten: menemukan artikel atau laporan dengan konten yang mirip secara otomatis. Clustering feedback pelanggan untuk menemukan tema keluhan yang paling umum tanpa labeling manual. Anomaly detection: menemukan transaksi yang 'jauh' dari pola normal dalam vector space

Question 3

Apa kesalahpahaman umum tentang Embedding?

Accepted Answer

Embedding bukan terjemahan literal. Teks dalam bahasa Indonesia dan Inggris dengan makna sama bisa punya embedding yang dekat kalau model-nya multilingual.. Banyak yang kira embedding hanya untuk teks. Padahal gambar, audio, video, hingga perilaku pengguna juga bisa di-embed menggunakan model yang berbeda.. Embedding nggak 'tahu' fakta. Dia cuma menangkap pola statistik dari data training, bukan memahami dunia seperti manusia.

Tipe	Apa yang Di-embed	Dipakai untuk
Text Embedding	Kata, kalimat, paragraf	Semantic search, RAG, klasifikasi
Image Embedding	Foto, gambar	Pencarian gambar, deteksi objek
Graph Embedding	Node dan relasi	Rekomendasi, knowledge graph
User Embedding	Perilaku pengguna	Rekomendasi produk, personalisasi
Product Embedding	Atribut produk	Collaborative filtering

Model	Dimensi	Tipe	Catatan
OpenAI text-embedding-3-small	1536	Proprietary	Performa tinggi
sentence-transformers all-MiniLM-L6-v2	384	Open source	Ringan, cepat
Cohere Embed v3	1024	Proprietary	Multilingual kuat
paraphrase-multilingual-MiniLM	384	Open source	Bagus untuk Bahasa Indonesia

Embedding

Apa itu Embedding?

Analogi yang Lebih Konkret

Tipe-Tipe Embedding

Cara Kerja Semantic Search dengan Embedding

Model Embedding Populer

Kaitannya dengan Data Work