Итак, тему пользы и важности больших данных мы уже затронули, и пора перейти к тому, что и как можно с ними делать. Для этого необходимо ответить на вопросы, что такое большие данные, и в чем их особенности.

В общем-то, название говорит само за себя: объемы и темпы роста этих данных настолько большие, что традиционные инструменты аналитики, включая привычные информационные технологии, с ними попросту не справляются. Такие объемы данных сложно собирать, хранить, передавать кому-либо, анализировать, визуализировать, и искать нужную информацию среди всей этой массы. Поэтому зачастую большие данные остаются невостребованными и не получают шанса раскрыть весь свой потенциал. Для того, чтобы все-таки этот потенциал был раскрыт, и большие данные заработали на пользу организации (причем, как уже говорилось, речь может идти не только о бизнесе, но и общественных, научных, и других организациях), нужны алгоритмы и аналитический подход.

Но легче сказать, чем сделать: большие данные довольно коварны, и препятствий к их использованию множество — от технических, операционных, концептуальных. Это связано с объемами данных, их разнообразием, разной степенью достоверности и оборачиваемостью (часто наибольшую пользу могут принести данные, анализируемые по горячим следам, и при этом многие данные необходимо хранить в архивах и извлекать оттуда при необходимости). Эти черты больших данных получили название 4Vs: Volume, Variety, Veracity, and Velocity (Ohlhorst 3).

Поэтому существует несколько технологий, процессов и концепций, позволяющих добыть из приисков больших данных те элементы, которые реально продвинут бизнес: традиционный бизнес-анализ, статистические алгоритмы, анализ с прогнозированием, интеллектуальный или глубинный анализ, а также моделирование данных. Все эти технологии задействуют различные инструменты, платформы и способы аналитики ради того, чтобы добыть важную информацию о трендах и статистике, способную усилить позиции компании на рынке. На сегодня нет одной универсальной и идеальной технологии, которая позволяла бы проводить анализ больших данных с максимальной эффективностью. Разумеется, эта область — непаханое поле для специалистов по анализу, информационным технологиям и обработке данных. Однако тот факт, что технологии продолжают развиваться, не означает, что компаниям «лучше подождать». Ведь данные, во-первых, копятся и постоянно увеличиваются в объемах, во-вторых, порой теряют актуальность, а в-третьих, их можно использовать уже сейчас!

Большинство компаний — особенно это касается малого и среднего бизнеса — сталкиваются с существенными проблемами, подходя к вопросу анализа больших данных: чистота имеющихся данных, аналитические навыки и знания, понимание статистики и некоторые другие вопросы, связанные с образованием и компетентностью. Это все важно не только для самой процедуры анализа, но для того, чтобы проводить именно такой анализ и именно тех данных, которые принесут пользу бизнесу.

Для того, чтобы получить наглядное представление об аналитике, а также приобрести кое-какой опыт, полезно попробовать начать с анализа трафика своего вебсайта (разумеется, тем, кто этого еще не делает). Для сбора данных можно использовать многочисленные онлайн инструменты (например, Extrativ, Neddlebase, 80Legs), которые позволяют собрать информацию из социальных сетей, отзывы о продуктах, списки продаж и другие данные, которые могут быть важны для конкретного бизнеса и послужить хорошим ресурсом. Попробовав для начала проанализировать хотя бы некоторые из полученных данных, как правило, компания понимает, что большие данные имеют для нее огромную ценность — впрочем, как и для всех других бизнесов. Главная хитрость тут — с умом подойти к выбору и анализу этих данных. В конце концов, в сегодняшнем деловом мире без них очень сложно, если не невозможно, оставаться конкурентоспособным.