Buat kamu yang baru mengenal dunia data, penasaran ga sih gimana data di perusahaan itu di proses dan akhirnya bisa dimanfaatkan?
Nah di artikel kali ini aku bakal bahas gimana sih proses pemanfaatan data secara general di industri.
Pemanfaatan data di mulai dari pengumpulan data sampai akhirnya akan di manfaatkan dalam beberapa bentuk seperti report, dashboard atau machine learning model.
Biar lebih jelas, coba deh check gambar ini.
Data Process. Image by Semantix
Data Process. Image by Semantix
Yuk kita bahas step by step ya

Sumber data

Kita mulai dari yang warna ungu yang menggambarkan sumber data.
notion image
Image Generated using Canva Dream Lab
Secara umum data di perusahaan biasanya tersebar di berbagai sumber. Data tersebut bisa terbentuk dan tersimpan di berbagai tempat dan dalam berbagai tempat, misalnya di:
  • Database
  • Aplikasi
  • File dan Spreadsheet
  • Platform External

Data Processing

Data tersebut kemudian akan di pindahkan kedalam data lake yang kemudian akan di proses di data warehouse.
Proses ini umum di sebut dengan proses Extract Transform Load (ETL). Proses ini juga bisa dilakukan dengan urutan Extract Load Transform (ELT).
  • Extract disini maksudnya data di ambil dari sumber data.
  • Transform maksudnya data mentah yang kita dapat di rubah format dan strukturnya agar bisa di gunakan atau digabungkan dengan data lain.
  • Load adalah proses menyimpan datanya.
Di dalam data warehouse biasanya juga akan di lakukan transformasi data dan disitu juga ada beberapa komponen yang perlu di perhatikan seperti data catalog, discovery, lineage, dan keamanannya.
Tujuan dari proses ini adalah data yang tadinya masih mentah dan terpisah sekarang sudah berada di dalam satu sempat dan siap di manfaatkan.

Pemanfaatan Data

Image Generated using Canva Dream Lab
Image Generated using Canva Dream Lab
Tahap selanjutnya adalah memanfaatkan data yang sudah tersimpan di data warehouse tersebut.
Pemanfaatannya pun bisa dalam berbagai bentuk.
Salah satu pemanfaatannya bisa dengan memberikan akses data warehouse tersebut kepada tim-tim lain yang membutuhkan data yang sudah di proses di data warehouse.
Pemanfaatan lainnya bisa dengan membuat chart dan dashboard dari data tersebut untuk menganalisa kejadian-kejadian yang sudah terjadi sebelumnya. Hal ini biasa di sebut juga dengan descriptive analytics.
Dari situ juga kita bisa melakukan diagnostik analisis untuk mengetahui alasan terjadinya kejadian di masa lampau. Selain yang sudah di sebutkan data-data tersebut juga dapat dimanfaatkan untuk pengembangan Machine Learning untuk melakukan prediktif dan prescriptive analysis.
Model machine learning yang sudah di buat ini kemudian bisa di manfaatkan dengan pembuatan API tersendiri agar dapat di integrasikan dengan platform lain atau langsung di manfaatkan untuk menghasilkan prediksi dalam periode waktu tertentu.

Penutup

Nah, jadi harusnya sekarang kalian udah mulai tergambar ya tentang gimana sih data itu di manfaatkan di organisasi. Mulai dari data mentah yang tersebar sampai akhirnya menjadi sebuah produk data.
Yang pasti agar proses ini berjalan dengan baik perlu adanya skill set tertentu yang harus di miliki. Itulah juga yang menyebabkan munculnya beberapa pekerjaan yang beda-beda di bidang data.
 
Share this article

Mau tetep update soal ilmu data?

Join sama 3000+ subscriber lain yang udah update skill bareng Ngulik Data