Компания IBM объявила о запуске Integrated Analytics System, новой единой системы обработки данных. Она предоставляет быстрый и легкий доступ к передовым возможностям анализа информации и позволяет работать с данными в частных, публичных или гибридных облачных средах.
Система сочетает различные инструменты обработки данных и позволяет специалистам оперативно разрабатывать и развертывать инновационные аналитические модели непосредственно в хранилище данных, тем самым повышая производительность. Система создана на базе IBM Common SQL Engine, поэтому заказчики могут использовать его для удобного перемещения рабочих задач в публичное облако. Кроме того, она позволяет осуществить автоматизацию бизнеса с помощью машинного обучения. Популярный механизм СУБД используется в локальных и облачных базах данных, поэтому пользователи могут перемещать данные и направлять запросы во всем разнообразии хранилищ информации, таких как Db2 Warehouse on Cloud или Hortonworks Data Platform.
Основными составляющими Integrated Analytics System являются решения IBM Data Science Experience, Apache Spark и Db2 Warehouse. Все они были оптимизированы для совместной работы. Data Science Experience предлагает набор инструментов обработки критически важных данных и совместное рабочее пространство, с помощью которого специалисты могут создавать новые аналитические модели. В свою очередь, разработчики могут использовать такие модели для быстрого и удобного построения умных приложений. Включение Apache Spark, известного фреймворка с открытым исходным кодом, позволяет обрабатывать данные в оперативной памяти. Такой подход ускоряет работу аналитических приложений благодаря обработке информации непосредственно в месте ее хранения.
Новой особенностью этого класса решений являются возможности машинного обучения, которые интегрированы в систему наряду с Data Science Experience и Spark. Благодаря этому, информацию не нужно перемещать для проведения анализа, что уменьшает количество необходимых действий и сокращает время простоя из-за ожидания запуска и отклика аналитической системы. Такой подход упрощает процесс обучения и оценки прогнозных моделей, а также их тестирования и развертывания, поскольку все происходит в единой системе.
«Сочетание высокой производительности и передовой аналитики — начиная от Data Science Experience до платформы с открытым исходным кодом Spark — предоставляет нашим бизнес-аналитикам возможность легко и оперативно проводить масштабные исследования данных, — сказал Виталий Цивин, исполнительный вице-президент AMC Networks, тестировавший систему в течение несколько месяцев. — Система Integrated Analytics System позиционируется как неотъемлемый компонент корпоративной архитектуры данных. Она соединяет хранилище данных IBM Netezza Data Warehouse, систему IBM PureData System for Analytics, облачные кластеры Db2 Warehouse on Cloud и другие источники информации».
«Этот запуск является продолжением нашей проактивной стратегии, нацеленной на расширение доступа к научному анализу данных и машинному обучению. Решение помогает таким организациям, как AMC начать интеллектуальную обработку огромных массивов информации и получение инсайтов», – сказал Роб Томас, руководитель IBM Analytics.
Интегрированная архитектура новой системы сочетает функции программного обеспечения, такие как ассиметричная массово-параллельная обработка данных (AMPP), с технологией IBM Power и аппаратными средствами хранения на основе флэш-памяти. Система построена на базе IBM PureData System for Analytics и предыдущих решений в области хранилищ данных IBM Netezza. Кроме того, она поддерживает широкий набор типов и сервисов данных, начиная от Watson Data Platform и IBM Db2 Warehouse On Cloud до Hadoop и IBM BigSQL. Подобно этим решениям, Integrated Analytics System построена на базе IBM Common SQL Engine, что позволяет заказчикам с легкостью объединять локальную систему и облачные хранилища.
Кроме того, стандартные отраслевые инструменты и стандартный механизм SQL позволяют легко перемещать рабочие нагрузки в публичные или частные облака с помощью кластеров Spark с учетом требований пользователя.
Как и все существующие хранилища данных IBM, Integrated Analytics System предлагает встроенную виртуализацию данных и совместимость с Netezza, Db2 и IBM PureData System for Analytics.
Помимо перечисленных возможностей, новая система также предлагает гибридную транзакционно-аналитическую обработку (HTAP). В отличие от обычных бизнес-сред, где такие процессы запускаются на базе отдельных архитектур, HTAP управляет прогнозной аналитикой, транзакционной и архивной информацией в единой базе данных с ускоренным временем ответа. Позднее в этом году компания планирует добавить поддержку HTAP на IBM Db2 Analytics Accelerator for z/OS, что упростит интеграцию системы с инфраструктурой IBM z System