Computer Vision

Lanjutan

Bidang AI yang memungkinkan komputer menginterpretasi dan memahami informasi visual dari dunia nyata seperti gambar dan video, mencakup tugas seperti deteksi objek, segmentasi, dan OCR.

Computer Vision adalah cabang AI yang berfokus pada pemberian kemampuan "melihat" dan memahami konten visual kepada komputer. Bidang ini menggabungkan image processing, machine learning, dan deep learning untuk mengekstrak informasi bermakna dari gambar dan video.

Task-Task Utama Computer Vision

TaskDeskripsiContoh Aplikasi
Image ClassificationMengategorikan gambar ke kelasKlasifikasi produk, diagnosis medis
Object DetectionLokalisasi dan identifikasi objekCCTV, autonomous driving
Semantic SegmentationLabel per pikselPemetaan area, surgical robot
Instance SegmentationBedakan instance berbeda kelas samaHitung produk di rak
OCREkstrak teks dari gambarDigitalisasi dokumen, plate recognition
Pose EstimationDeteksi posisi tubuh/sendiFitness tracker, AR

Evolusi Computer Vision

  • Era Pre-Deep Learning: Edge detection (Canny), SIFT, HOG, SVM
  • AlexNet (2012): CNN pertama yang dominan di ImageNet → revolusi DL
  • ResNet, VGG, Inception: Arsitektur CNN yang lebih dalam dan akurat
  • YOLO series: Real-time object detection
  • Vision Transformer (ViT): Transformer architecture untuk gambar
  • Multimodal (2022+): CLIP, SAM, GPT-4V - teks + gambar

Pipeline Computer Vision Umum

  1. Data collection & annotation: Kumpulkan dan label gambar
  2. Preprocessing: Resize, normalisasi, augmentasi
  3. Model selection: Pre-trained CNN atau fine-tuning
  4. Training & validation: Transfer learning lebih cepat dan efisien
  5. Inference optimization: Quantization, pruning untuk deployment
Lanjut Latihan

Udah paham Computer Vision? Lanjut latihan SQL dan Excel yuk!

Latihan interaktif, langsung di browser.

Mulai Latihan →