10-07-20
Выбор платформы для бизнес-анализа

Бизнес-аналитика (BI), давно завоевав позиции в  финансовом секторе, торговле и маркетинге сейчас активно осваивает все сферы и уровни рынка. Появилось множество систем для анализа больших данных (Microsoft Power BI, Tableau Public, Logi Analytics, MicroStrategy, TIBCO Software, QlikView, Heap Analytics, Hootsuite, Qualtrics Research Core, Wyn Enterprise, Looker, пр.), но ожидается, что появится еще больше.

Востребованность этих инструментов объясняется способностью непрерывно собирать, анализировать  и переводить на понятный язык большое количество данных как из структурированных, так и из неструктурированных источников для определения факторов эффективности работы, результатов принятия решения, создания моделей развития и реализации других возможностей бизнес-анализа. Современные BI системы универсальны и удобны в использовании. Так, в web проекте с помощью BI инструмента вы можете анализировать не только поведение посетителей на сайте, но и их активность в соцсетях, поисковую деятельность, демографические, социальные и другие характеристики для проверки гипотез маркетинговой стратегии, построения модели сайта, выбора пакета услуг, ценовой политики и пр. В классической розничной торговле с помощью создания и анализа различных корреляций между ассортиментом товаров, сезонностью, графиками работы персонала, организацией логистики и пр. — влиять на объемы продаж в режиме реального времени.

Поставщики программного обеспечения предлагают автономные приложения или интеграции с существующими системами решения и корпоративными пакетами, такими как ERP, CRM, CMS, внедряют машинное обучение и нейросети (ИИ), чтобы научить системы самостоятельно искать варианты анализа и корреляций между базами данных в самом широком диапазоне. Выбирая на таком конкурентоспособном рынке, стоит начать с определения ваших целей и ресурсов, чтобы сформулировать свои  приоритеты. 

В бизнес-анализе участвуют информационные активы компании (служебная, управляющая, аналитическая, деловая и пр. информация), значит необходимо учесть риск нелегального доступа к ним. Растущий вместе с динамикой рынка объем данных и, соответственно, увеличение количества вычислительных узлов (плюс дополнительные для отказоустойчивости сервера), объективная необходимость размещения данных для хранения и обработки на одном сервере с целью экономии расходов за передачу большого потока данных, совершенно логично делают аппаратное обеспечение ключевым фактором выбора системы. Хорошим решением могут стать собственные или арендованные физические серверы для обеспечения работы инструмента. 

Важными являются также вопросы о взаимодействии продукта с вашим хранилищем данных и инструментами ETL, о возможности разработки в системе пользовательских решений для потребностей бизнеса, степени зависимости от пакета услуг разработчика; от подготовки и опыта сотрудников, которые будут с ней работать. Ответом на них является self-service индекс платформы. При высоком значении Вы можете быть уверены в том, что перед Вами гибкий и самостоятельный в работе продукт, удобный даже для специалиста без глубоких знаний в data science. 

Выбор BI платформы действительно сложный, и мы предлагаем на конкретных примерах посмотреть, что предлагает рынок.   

Microsoft Power BI

Лидер отрасли. Продукт 13 лет подряд занимает первую строчку в номинации ”Платформы анализа и бизнес-аналитики“ рейтинга Gartner Magic Quadrant.

Инструмент предназначен для выявления тенденций по мере их возникновения, оснащен комплексными информационными панелями и совместим с любым устройством.

Среди преимуществ: неограниченный доступ к локальным и облачным данным, сотни визуализаций с возможностью их совместного использования и быстрое взаимодействие данных с помощью готовых и настраиваемых шаблонов. Система может быть интегрирована с Microsoft как Excel, Azure и SQL Server. Использование Azure позволяет организовать совместную работу различных специалистов по обработке и анализу данных и предоставить всем сотрудникам средства бизнес-аналитики и аналитические отчеты, оптимизировав их в зависимости от уровня должности. Локальную работу с отчетами обеспечивает сервер отчетов Power BI, который включен в платный пакет Power BI Pro. C помощью приложения Вы можете создать собственную облачную среду и экономить на  приобретении лицензий для каждого пользователя. 

Благодаря встроенным возможностям ИИ и модели машинного обучения инструмент позволяет оперативно получать аналитические сведения из широкого диапазона источников от датчиков фабрики до социальных сетей (включая изображения) в режиме реального времени. Совместное использование Power BI, Power Apps и Power Automate, позволяет создавать чат-боты без кодирования и самостоятельно автоматизировать рабочие процессы.

В сухом остатке: до 1 Гб объёма данных размещаемых в облаке, создание, просмотр и совместное использование информационных панелей и отчетов, авторский контент, исследование данных, платный профессиональный пакет.

Tableau Public

Tableau Public — ближайший конкурент предыдущего решения, тоже коммерческий продукт. Позволяет за считанные минуты создавать интерактивные диаграммы и графики, карты и информационные панели онлайн, развлекательные приложения (и обмениваться ими), а также публикации на их основе. 

Программное обеспечение отображает изменения в незаметных данных, подчеркивает уровни изменений и продолжительность в значениях. Можно спроектировать, настроить и опубликовать одну приборную панель с оптимизированными представлениями через браузер, настольный компьютер, мобильный телефон или встроить в любое приложение.

Система, например, может легко сопоставить навыки любого работника с необходимыми, подготовить, создать, исследовать или просмотреть доверенные данные. Tableau позволяет объединить разрозненные данные без написания кода и в реальном времени интегрироваться в существующую инфраструктуру данных. 

Продукт обеспечивает безопасное сотрудничество пользователей для поддержки сквозного аналитического рабочего процесса, может поддерживать до ста пользователей на одно ядро, масштабируется за счет увеличения аппаратных ресурсов. Система разворачивается локально, в облаке, с помощью хостинга, интегрирована с Windows, Linux, Mac. Инструмент позволяет работать с данными в Google Sheets, PDF и пространственными файлами, интегрирован с Microsoft Excel и CSV, дополнен механизмом интерпретации данных. 

Helicalinsight

Helical Insight — BI open source решение, совместимое со всеми современными браузерами. У продукта комфортный интерфейс, а работа пользователя  не требует  дополнительно обучения и технических знаний.

Инструмент обладает стандартными функциями BI площадки (создание отчетов, информационных панелей, управление ролями пользователей, поддержка сообщества, XML управляемый рабочий процесс, и т.д.), и возможностью их расширения за счет API и SDK. 

Встроенный механизм правил Workflow позволяет вызывать различную функциональность и реализовывать пользовательские бизнес-процессы вне зависимости от поставщика. Создание и работа системы полностью основаны на браузере и доступны в любом месте и в любое время. 

Платформа поддерживает RDBMS, NoSQL и Big data Microsoft Azure SQL, базу данных Amazon RedShift и Google Cloud Sql, а также обеспечивает тесную интеграцию с драйвером JDBC4, который позволяет напрямую подключаться практически к любой базе данных

Использование JavaScript, HTML, CSS и AJAX делает доступным любой вид настройки и анимации в платформе. Можно настроить абсолютно все, от заголовка, нижнего колонтитула, уведомлений, хранилища файлов, навигации, контекстного меню и т. д. Встроен механизм документооборота, позволяющий создавать бизнес-процессы, специфичные для вашего бизнеса. Пользователи могут экспортировать отчеты/информационные панели в различные форматы файлов, такие как PDF, JPEG, PNG, Excel и т.д. 

ELK Stack

Простой, но мощный BI инструмент на основе открытого кода (свободная лицензия Apache 2.0), отразивший невероятную универсальность уже в названии. Аббревиатура ”ELK“ собрана из названия трех open source проектов: поисковой и аналитической системы Elasticsearch;  конвейера для обработки данных Logstash и инструмента для  визуализации данных Kibana. Масштабируемая и гибкая, система гиперпопулярна среди пользователей.

Продукт может быть развернут на физическом оборудовании, в виртуальной среде, частном облаке или простом публичном облаке (например, Google, Azure, AWS). 

Обладает горизонтальной масштабируемостью и устойчивостью, индексом управления жизненным циклом, включает многопользовательское сотрудничество, горячую и теплую архитектуру, мониторинг как одного так и нескольких стеков, docker контейнеризацию, встроенные системы безопасности и многое другое. По умолчанию проект предлагает своим клиентам 976 ГБ ОЗУ, которые можно по запросу увеличить.

Проект обладает расширенными возможностями настройки и повышенной совместимостью инструмента при наличии гибких рабочих функций (включая машинное обучение, безопасность и отчетность). Так, машинное обучение позволяет визуализировать и анализировать результаты в режиме реального времени в широком диапазоне вариантов использования и наборов данных альтернативными способами, в том числе в качестве источника для другой аналитики машинного обучения.  

Если у вас нет серверных мощностей, Вы можете попробовать бесплатную 14-дневную пробную версии с кластером Elasticsearch в 256 МБ зарезервированной памяти и 2 ГБ зарезервированного дискового пространства. При установке дистрибутива на собственные серверы по умолчанию получаете бесплатную базовую лицензию без срока действия. 

Учитывая универсальность применения и многообразие предложений BI инструментов на рынке в различных ценовых категориях (включая бесплатные оpen source решения), мы предлагаем выбирать платформу, опираясь на преимущество самого BI — рациональный подход, и начать с определения своих целей и ресурсов. Такие характеристики систем как возможности настройки, визуализация, удобство интерфейса, диапазон отчетов, и пр. лишь завершат список требований к инструменту. 

Да, выбрать программное решение для анализа больших данных сложно. И не только потому, что само программное обеспечение сложное и со временем становится все сложнее, сложно связать переменные и нюансы бизнеса (учитывая его развитие), с выбираемым программным решением и его обеспечением. Но, если Вы выберете инструмент BI без осознания бизнес-необходимости, не стоит рассчитывать, что хранилище данных по умолчанию удовлетворит все требования доступа к информации и ее обработке.