Обґрунтовані великі дані: як подолати розрив між науковцями та інженерами

Шум навколо великих даних створив широке помилкове уявлення: що саме його існування може забезпечити компанію дійових розумінь та позитивних результатів бізнесу. Реальність дещо складніша. Щоб отримати цінність від великих даних, вам потрібна спроможна команда науковців, щоб проглянути її. Здебільшого, корпорації це розуміють, про що свідчить зростання в 15 разів - 20 разів робочих місць науковців з 2016 по 2019 рік. Однак, навіть якщо у вас є спроможна команда науковців даних, вам все одно потрібно очистити основні проблеми втілення цих ідей у ​​виробництво. Щоб усвідомити справжню цінність для бізнесу, ви повинні переконатись, що ваші інженери та науковці даних працюватимуть узгоджено між собою. По суті, науковці даних - це новатори, які видобувають нові ідеї та думки з даних, які ваша компанія щодня приймає, в той час як інженери, в свою чергу, будують ці ідеї та створюють стійкі лінзи, на яких можна переглянути наші дані. Дані вчених мають завдання розшифровувати, маніпулювати та продавати дані з метою отримання позитивних результатів бізнесу. Щоб здійснити цей подвиг, вони виконують найрізноманітніші завдання, починаючи від пошуку даних до статистичного аналізу. Збір, організація та інтерпретація даних проводиться для пошуку значущих тенденцій та відповідної інформації. Хоча інженери, безумовно, співпрацюють із науковцями даних, є кілька чітких відмінностей між двома ролями. Однією з принципових відмінностей є те, що інженери оцінюють рішуче значення щодо «виробничої готовності» систем. Від стійкості та безпеки моделей, створених науковцями даних, до фактичного формату та масштабованості, інженери хочуть, щоб їх системи були швидкими та надійними. Іншими словами: вчені-дані та інженерні колективи щодня побоюються. Це ставить питання, як ви можете позиціонувати обидві ролі для успіху і в кінцевому підсумку витягти із своїх даних найбільш змістовні відомості? Відповідь полягає у присвяченні часу та ресурсів на вдосконалення даних та інженерних відносин. Так само як важливо зменшити безлад або «шум» навколо наборів даних, так само важливо згладити будь-яке тертя між цими двома командами, які грають життєво важливу роль у вашому успіху бізнесу. Ось три критичні кроки, щоб зробити це реальністю. Недостатньо просто помістити в кімнату кількох вчених та кількох інженерів і попросити їх вирішити світові проблеми. Спочатку потрібно змусити їх зрозуміти термінологію один одного і почати говорити однією мовою. Один із способів зробити це - тренувати команди. З’єднуючи вчених та інженерів на дві частини, ви можете заохотити спільне навчання та подолати бар'єри. Для науковців даних це означає вивчення моделей кодування, написання коду більш організованим способом, і, можливо, найголовніше, розуміння технології та компромісів у галузі інфраструктури, пов'язаних із впровадженням моделі у виробництво. Опубліковано 7wData.be