Data besar yang boleh dikesan: Bagaimana untuk merapatkan jurang antara saintis dan jurutera data

Buzz di sekeliling data besar telah mencipta salah tanggapan yang meluas: kewujudannya semata-mata dapat memberikan sebuah syarikat dengan wawasan yang dapat ditindaklanjuti dan hasil perniagaan yang positif. Kenyataannya agak rumit. Untuk mendapatkan nilai dari data besar, anda memerlukan pasukan saintis data yang mampu menapisnya. Untuk sebahagian besar, syarikat memahami ini, seperti yang dibuktikan oleh pertumbuhan 15x-20x dalam data saintis data dari 2016 hingga 2019. Walau bagaimanapun, walaupun anda mempunyai pasukan saintis data yang berkemampuan di tangan, anda masih perlu membersihkan halangan utama meletakkan idea-idea itu ke dalam pengeluaran. Untuk merealisasikan nilai perniagaan yang benar, anda perlu memastikan jurutera dan saintis data anda bekerja bersama satu sama lain. Pada teras mereka, para saintis data adalah inovator yang mengekstrak idea dan pemikiran baru dari data syarikat anda ingests setiap hari, sementara jurutera pula membuang idea-idea itu dan mewujudkan kanta mampan untuk melihat data kami. Para saintis data ditugaskan untuk menguraikan, memanipulasi, dan merchandising data untuk hasil perniagaan yang positif. Untuk mencapai prestasi ini, mereka melakukan pelbagai tugas dari data perlombongan kepada analisis statistik. Mengumpul, menganjurkan, dan menafsirkan data semuanya dilakukan dalam usaha mengenal pasti trend penting dan maklumat yang relevan. Walaupun jurutera tentu bekerja dengan konsisten dengan para saintis data, terdapat beberapa perbezaan yang jelas antara kedua-dua peranan tersebut. Salah satu perbezaan asas adalah bahawa jurutera meletakkan nilai yang lebih tinggi pada "kesediaan yang produktif" sistem. Dari ketahanan dan keselamatan model-model yang dihasilkan oleh saintis data ke format dan skalabilitas sebenar, para jurutera mahukan sistem mereka cepat dan boleh dipercayai berfungsi. Dalam erti kata lain: Para saintis data dan pasukan kejuruteraan mempunyai kebimbangan yang berbeza setiap hari. Ini menimbulkan persoalan, bagaimana anda boleh meletakkan kedua-dua peranan untuk berjaya dan akhirnya mengeluarkan wawasan yang paling bermakna dari data anda? Jawapannya terletak pada mendedikasikan masa dan sumber untuk menyempurnakan data dan hubungan kejuruteraan. Sama pentingnya untuk mengurangkan kekacauan atau "bunyi bising" di sekitar set data, ia juga penting untuk melicinkan apa-apa dan semua geseran di antara kedua-dua pasukan yang memainkan peranan penting dalam kejayaan perniagaan anda. Berikut adalah tiga langkah penting untuk menjadikannya realiti. Tidak cukup untuk hanya meletakkan beberapa saintis dan beberapa jurutera di dalam bilik dan meminta mereka menyelesaikan masalah dunia. Anda perlu memahami istilah masing-masing dan mula bercakap bahasa yang sama. Salah satu cara untuk melakukan ini adalah melatih semua pasukan. Dengan berpasangan ahli-ahli sains dan jurutera ke dua, anda boleh menggalakkan pembelajaran bersama dan memecahkan halangan. Untuk para saintis data, ini bermakna corak pengekodan pembelajaran, menulis kod dengan cara yang lebih teratur, dan, yang paling penting, memahami penumpuan dan prasarana infrastruktur yang terlibat dengan memperkenalkan model ke dalam pengeluaran. Dihantar pada 7wData.be