Data Scientist atau ilmuwan data adalah generasi baru pakar data analitik yang memiliki keterampilan teknis untuk memecahkan masalah yang kompleks dan rasa ingin tahu untuk mengeksplorasi masalah apa yang perlu dipecahkan.
Mereka adalah sebagian ahli matematika, sebagian ilmuwan komputer, dan sebagian pencari tren. Dan, karena mereka mengusai dunia bisnis dan TI, mereka sangat dicari dan dibayar dengan baik. Siapa yang tidak ingin menjadi salah satunya?
Mereka juga merupakan tanda zaman. Ilmuwan data tidak berada di banyak radar satu dekade yang lalu, tetapi popularitas mereka yang tiba-tiba mencerminkan bagaimana bisnis sekarang berpikir tentang data besar. Massa informasi yang tidak terstruktur yang berat itu tidak dapat lagi diabaikan dan dilupakan. Ini adalah tambang emas virtual yang membantu meningkatkan pendapatan – selama ada seseorang yang menggali dan menggali wawasan bisnis yang sebelumnya tidak terpikirkan oleh siapa pun.
Dari mana mereka berasal?
Banyak ilmuwan data memulai karir mereka sebagai ahli statistik atau analis data. Tetapi ketika data besar (baik penyimpanan data besar dan teknologi pemrosesan) mulai tumbuh dan berkembang, peran itu juga berkembang. Data bukan lagi sekadar renungan untuk ditangani TI. Ini adalah informasi kunci yang membutuhkan analisis, keingintahuan yang kreatif, dan kemampuan untuk menerjemahkan ide-ide berteknologi tinggi menjadi cara-cara baru untuk menghasilkan keuntungan.
Peran ilmuwan data juga memiliki asal-usul akademis. Beberapa tahun yang lalu, universitas mulai menyadari bahwa pengusaha menginginkan orang-orang yang merupakan programmer dan pemain tim. Banyak universitas bersiap untuk menghasilkan ilmuwan data generasi berikutnya. Sekarang ada lebih dari 60 program serupa di universitas di seluruh negeri.
Tugas pekerjaan khas untuk ilmuwan data
Tidak ada deskripsi pekerjaan yang pasti dalam hal peran ilmuwan data. Tapi berikut adalah beberapa hal yang mungkin akan dilakukan:
- Mengumpulkan sejumlah besar data yang sulit diatur dan mengubahnya menjadi format yang lebih bermanfaat.
- Memecahkan masalah terkait bisnis menggunakan teknik berbasis data.
- Bekerja dengan berbagai bahasa pemrograman, termasuk SAS, R dan Python.
- Memiliki pemahaman yang kuat tentang statistik, termasuk uji statistik dan distribusi.
- Tetap di atas teknik analitik seperti pembelajaran mesin, pembelajaran mendalam, dan analitik teks.
- Berkomunikasi dan berkolaborasi dengan TI dan bisnis.
- Mencari urutan dan pola dalam data, serta melihat tren yang dapat membantu keuntungan bisnis.
Apa saja peralatan ilmuwan data?
Istilah dan teknologi ini biasanya digunakan oleh para ilmuwan data:
- Data visualization: penyajian data dalam format gambar atau grafik sehingga dapat dengan mudah dianalisis.
- Machine learning: cabang kecerdasan buatan berdasarkan algoritma matematika dan otomatisasi.
- Deep learning: area penelitian pembelajaran mesin yang menggunakan data untuk memodelkan abstraksi yang kompleks.
- Pattern recognition: teknologi yang mengenali pola dalam data (sering digunakan secara bergantian dengan pembelajaran mesin).
- Data preparation: proses mengubah data mentah menjadi format lain agar lebih mudah dikonsumsi.
- Text analytics: proses pemeriksaan data tidak terstruktur untuk mengumpulkan wawasan bisnis utama.