Мета: оновлення процесів збору та аналізу даних для побудови прогнозних моделей з метою прийняття економічно вигідних рішень.
Преамбула: Дані представляють нову нафту економіки, проте більшість компаній, хоча й збирають і зберігають терабайти даних в хмарних сервісах, не до кінця використовують (і найчастіше розуміють) їхній потенціал. Наша мета – простою мовою пояснити переваги використання даних і розробити ефективні методи прогнозу під вашу компанію. Наша робота не обмежується «загальним посібником, діловими порадами», а передбачає підготовку ваших аналітиків до використання моделей, які реально працюють.
Робота з замовником будується на основі стандартної методології СRISP-DM:
Етап 0 (безкоштовний): Розуміння бізнесу
- Зустріч з аналітиками та менеджментом Замовника для визначення потреби (наприклад, прогноз відвантажень за різними номенклатурами, оцінка ефективності реклами, ключові і проблемні постачальники/покупці/співробітники, прогноз сезонності і т.д.)
Етап 1: Розуміння даних (2-4 дні)
- Підписання угоди про конфіденційність даних (за потреби)
- Отримання доступу до даних і аудит методології збору даних
- Оцінка рівня підготовки внутрішніх аналітиків компанії і розробка індивідуального плану перепідготовки
Етап 2: Підготовка даних (2-5 днів)
- Розуміння структури даних і ключових елементів матриці даних
- Аудит внутрішньої цілісності даних на наявність помилок
- Підготовка даних для аналізу
Етап 3: Моделювання (4-6 днів)
- Розробка моделей (класична регресія і методи машинного навчання)
- Обговорення з аналітиками компанії
- Тестування моделей на предмет помилок
- Вибір оптимальної моделі на основі якості прогнозу
Етап 4: Оцінка (1-2 дні через 3 місяці після попереднього етапу)
- Тестування моделей прогнозу на нових даних
- Налаштування моделей
Етап 5: Впровадження
- Передача моделей, які працюють, аналітикам компанії
- Використання результатів прогнозу при прийнятті управлінських рішень
Експерт: Максим Обрізан активно працює з даними з 2001 року, має досвід побудови як стандартних статистичних прогнозних моделей, так і сучасних методів на основі машинного навчання.