Computer Vision
Bidang AI yang memungkinkan komputer menginterpretasi dan memahami informasi visual dari dunia nyata seperti gambar dan video, mencakup tugas seperti deteksi objek, segmentasi, dan OCR.
Computer Vision adalah cabang AI yang berfokus pada pemberian kemampuan "melihat" dan memahami konten visual kepada komputer. Bidang ini menggabungkan image processing, machine learning, dan deep learning untuk mengekstrak informasi bermakna dari gambar dan video.
Task-Task Utama Computer Vision
| Task | Deskripsi | Contoh Aplikasi |
|---|---|---|
| Image Classification | Mengategorikan gambar ke kelas | Klasifikasi produk, diagnosis medis |
| Object Detection | Lokalisasi dan identifikasi objek | CCTV, autonomous driving |
| Semantic Segmentation | Label per piksel | Pemetaan area, surgical robot |
| Instance Segmentation | Bedakan instance berbeda kelas sama | Hitung produk di rak |
| OCR | Ekstrak teks dari gambar | Digitalisasi dokumen, plate recognition |
| Pose Estimation | Deteksi posisi tubuh/sendi | Fitness tracker, AR |
Evolusi Computer Vision
- Era Pre-Deep Learning: Edge detection (Canny), SIFT, HOG, SVM
- AlexNet (2012): CNN pertama yang dominan di ImageNet → revolusi DL
- ResNet, VGG, Inception: Arsitektur CNN yang lebih dalam dan akurat
- YOLO series: Real-time object detection
- Vision Transformer (ViT): Transformer architecture untuk gambar
- Multimodal (2022+): CLIP, SAM, GPT-4V - teks + gambar
Pipeline Computer Vision Umum
- Data collection & annotation: Kumpulkan dan label gambar
- Preprocessing: Resize, normalisasi, augmentasi
- Model selection: Pre-trained CNN atau fine-tuning
- Training & validation: Transfer learning lebih cepat dan efisien
- Inference optimization: Quantization, pruning untuk deployment
Istilah Terkait
Machine Learning
Machine Learning & AICabang kecerdasan buatan yang memungkinkan sistem komputer belajar dari data secara otomatis untuk membuat prediksi atau keputusan tanpa perlu diprogram secara eksplisit.
Deep Learning
Machine Learning & AISubset dari Machine Learning yang menggunakan jaringan saraf tiruan berlapis-lapis (neural network) untuk belajar representasi data secara hierarkis dari data besar.
Udah paham Computer Vision? Lanjut latihan SQL dan Excel yuk!
Latihan interaktif, langsung di browser.