Data Catalog
Inventaris terpusat dari seluruh aset data dalam organisasi, dilengkapi dengan metadata, dokumentasi, lineage, dan fitur pencarian untuk memudahkan tim menemukan, memahami, dan mempercayai data.
Data Catalog adalah sistem manajemen metadata yang berfungsi sebagai "perpustakaan" untuk semua aset data dalam organisasi - tabel, laporan, pipeline, model ML, dan lainnya.
Komponen Utama Data Catalog
Inventory Aset Data
Daftar lengkap semua aset data: tabel di data warehouse, laporan BI, API, file di data lake, model ML, dan lainnya.
Metadata Bisnis
Deskripsi dalam bahasa yang dipahami bisnis - bukan hanya nama kolom teknis, tapi makna sebenarnya.
Data Lineage
Visualisasi perjalanan data dari sumber ke tujuan - tabel ini datanya dari mana, digunakan di mana saja.
Search dan Discovery
Fitur pencarian untuk menemukan aset data berdasarkan nama, tag, deskripsi, atau pemilik.
Certification dan Trust
Penanda kepercayaan data - apakah tabel ini sudah divalidasi? Apakah ini official dataset perusahaan?
Collaboration
Komentar, pertanyaan, dan diskusi langsung di atas metadata - seperti "column customer_id ini apakah sama dengan yang di CRM?"
Data Catalog vs Data Dictionary
| Aspek | Data Catalog | Data Dictionary |
|---|---|---|
| Scope | Seluruh ekosistem data | Satu sistem/database |
| Lineage | Ya | Tidak |
| Search | Ya (full-text, tag) | Terbatas |
| Collaboration | Ya | Tidak |
| Auto-discovery | Ya (connect ke sistem) | Manual |
| Format | Tool/platform | Dokumen (Excel, Confluence) |
Istilah Terkait
Metadata
Data GovernanceData tentang data - informasi yang menjelaskan karakteristik, konteks, dan struktur dari sebuah dataset, seperti nama kolom, tipe data, waktu pembuatan, dan pemilik data.
Data Lineage
Data GovernanceRekam jejak perjalanan data dari sumber asalnya hingga tujuan akhir - menunjukkan asal-usul data, transformasi yang dilakukan, dan semua sistem yang dilalui sepanjang jalan.
Data Dictionary
Data GovernanceDokumen yang mendefinisikan arti, format, aturan, dan konteks bisnis dari setiap field (kolom) dalam sebuah sistem data - menjadi rujukan tunggal agar semua orang memahami data dengan cara yang sama.
Data Governance
Data GovernanceKerangka kebijakan, proses, dan tanggung jawab yang memastikan data dikelola secara konsisten, aman, berkualitas, dan sesuai regulasi di seluruh organisasi.
Udah paham Data Catalog? Lanjut latihan SQL dan Excel yuk!
Latihan interaktif, langsung di browser.