Question 1

Apa itu LLM?

Accepted Answer

LLM (Large Language Model) adalah model AI yang dilatih dengan miliaran teks untuk bisa memahami dan menghasilkan bahasa manusia. ChatGPT, Claude, dan Gemini semuanya berbasis LLM.

Question 2

Kapan LLM digunakan?

Accepted Answer

Ekstraksi data terstruktur dari email atau feedback pelanggan di e-commerce Indonesia. Pembuatan laporan analisis otomatis dari hasil query SQL. Chatbot layanan pelanggan yang bisa memahami konteks percakapan panjang. Klasifikasi dokumen internal (kontrak, invoice, laporan) tanpa training dari nol. Penulisan kode SQL atau Python dari deskripsi kebutuhan bisnis

Question 3

Apa kesalahpahaman umum tentang LLM?

Accepted Answer

Banyak yang kira LLM 'tahu' segalanya. Padahal LLM cuma mencocokkan pola dari data training. Kalau datanya nggak ada atau sudah usang, LLM bisa hallucinate: ngomong dengan yakin tapi salah.. LLM bukan database: dia nggak 'menyimpan fakta' seperti SQL table. Pengetahuannya terkurung di training data, makanya perlu RAG untuk info yang up-to-date.. Ukuran parameter lebih besar nggak selalu lebih baik untuk semua task. Model kecil yang di-fine-tune untuk domain spesifik sering mengalahkan model besar yang generik.

Model	Dibuat oleh	Konteks Window	Keunggulan
GPT-4o	OpenAI	128K token	Multimodal, ekosistem luas
Claude 3.5 Sonnet	Anthropic	200K token	Reasoning panjang, nuanced
Gemini 1.5 Pro	Google	1M token	Context window terbesar
Llama 3	Meta	128K token	Open source, bisa self-host

LLM

Apa itu LLM?

Gimana Cara Kerjanya?

Perbandingan LLM Populer

Kenapa Data Practitioners Perlu Tahu?

Konsep Penting: Hallucination