Цель: обновление процессов сбора и анализа данных для построения прогнозных моделей с целью принятия экономически выгодных решений.
Преамбула: Данные представляют новую нефть экономики, однако большинство компаний, хотя и собирают и хранят терабайты данных в облачных сервисах, не до конца используют (и зачастую понимают) их потенциал. Наша цель – простым языком объяснить преимущества использования данных и разработать эффективные методы прогноза под вашу компанию. Наша работа не ограничивается «общим руководством, деловыми советами», но предусматривает подготовку ваших аналитиков к использованию реально работающих моделей.
Работа с заказчиком строится на основе стандартной методологии СRISP-DM:
Этап 0 (бесплатный): Понимание бизнеса
- Встреча с аналитиками и менеджментом Заказчика для определения потребности (например, прогноз отгрузок по разным номенклатурам, оценка эффективности рекламы, ключевые и проблемные поставщики/покупатели/сотрудники, прогноз сезонности и т.д.)
Этап 1: Понимание данных (2-4 дня)
- Подписание соглашения о конфиденциальности данных (по необходимости)
- Получение доступа к данным и аудит методологии сбора данных
- Оценка уровня подготовки внутренних аналитиков компании и разработка индивидуального плана переподготовки
Этап 2: Подготовка данных (2-5 дней)
- Понимание структуры данных и ключевых элементов матрицы данных
- Аудит внутренней целостности данных на наличие ошибок
- Подготовка данных для анализа
Этап 3: Моделирование (4-6 дней)
- Разработка моделей (классическая регрессия и методы машинного обучения)
- Обсуждение с аналитиками компании
- Тестирование моделей на предмет ошибок
- Выбор оптимальной модели на основе качества прогноза
Этап 4: Оценка (1-2 дня через 3 месяца после предыдущего этапа)
- Тестирование моделей прогноза на новых данных
- Настройка моделей
Этап 5: Внедрение
- Передача работающих моделей аналитикам компании
- Использование результатов прогноза при принятии управленческих решений
Эксперт: Максим Обризан активно работает с данными с 2001 года, имеет опыт построения, как стандартных статистических прогнозных моделей, так и современных методов на основе машинного обучения.