spot_img
22 февраля, 2024
ДомойИнтервью«Dell PowerScale помогает извлекать ценную информацию из неструктурированных данных»

«Dell PowerScale помогает извлекать ценную информацию из неструктурированных данных»

Неструктурированные данные обладают огромным потенциалом для бизнеса, помогая понять результаты деятельности, быстро реагировать на возможные риски, а также предвидеть, что произойдет. Семейство систем хранения данных Dell PowerScale, которое было разработано Dell Technologies с использованием передового программного и аппаратного обеспечения, устанавливает новые отраслевые стандарты в этой области. Именно решениям в сфере неструктурированных данных была посвящена конференция, организаторами которой выступили компания Dell Technologies и НПК R.I.S.K., обладающая наивысшим партнерским статусом Dell Technologies Titanium в Азербайджане. Более подробно на эту тему мы поговорили с одним из докладчиков конференции, региональным менеджером Unstructured Data Solutions компании Dell Technologies Татьяной Бондаренко.

— Как предприятиям разобраться в неструктурированных наборах данных?

— В настоящее время мы переходим в эру, управляемую в основном данными. Организации активно проводят цифровую трансформацию, создавая постоянно растущие объемы данных. Согласно IDC, к 2025 году совокупная сумма мировых данных составит около 175 зеттабайт. И по мере увеличения источников генерации данных растут и объемы неструктурированных данных, обладающих огромным потенциалом, но разобраться в которых — непростая задача для любого бизнеса. Подсчитано, что на неструктурированные данные сегодня приходится почти 80% объема данных организаций. Ожидается, что этот объем будет расти из года в год, и он все больше распространяется по центрам обработки данных и облакам, что еще больше усложнит работу компаний. К тому же, хранение неструктурированных наборов данных, которые могут представлять большую ценность для предприятий, требует развертывания инновационных технологических решений для удобного доступа к ним и анализа.

Но прежде чем начинать анализировать неструктурированные данные, важно понять, какую цель вы хотите достичь. Например, вы можете искать определенные паттерны, связи между данными или выявлять тренды. Ясное понимание цели поможет определить, какие инструменты и технологии будут наиболее полезны при работе с данными. А чтобы предприятия могли лучше использовать неструктурированные данные, им потребуются подходящие решения для хранения данных с новым набором возможностей, которые помогут их структурировать. Именно здесь Dell Technologies играет решающую роль. Благодаря ведущему в отрасли портфелю систем хранения мы помогаем нашим клиентам извлекать максимум полезной информации из неструктурированных данных наиболее эффективным способом, а наши эксперты помогут идентифицировать ключевые факторы, на которые нужно обратить внимание в первую очередь, и оценить, насколько правильны результаты анализа данных.

— Какую информацию можно извлечь из подобных данных?

Неструктурированные данные — это данные, которые не имеют жесткой структуры и формата, например, тексты, фотографии, видео, аудио, сообщения в социальных сетях и т.д. Но несмотря на то, что эти данные могут быть сложными для анализа, из них можно извлечь много полезной информации, включающей:

  • Ключевые слова и фразы: анализ текстов позволяет извлекать ключевые слова и фразы, которые помогают понимать содержание документов и улучшать поиск информации.
  • Эмоциональный окрас: анализ тональности текста помогает понимать эмоциональный окрас документов, комментариев в социальных сетях, отзывов и т.д.
  • Связи и отношения: анализ неструктурированных данных позволяет искать связи и отношения между объектами. Например, вы можете исследовать связь между клиентами и продуктами, событиями и местами.
  • Категоризация: с помощью анализа неструктурированных данных можно создавать категории и группы, которые позволяют организовать данные и делать выводы о тенденциях и трендах.
  • Образцы и предсказания: анализ неструктурированных данных может помочь выявить образцы и закономерности, которые могут быть использованы для предсказания будущих событий и тенденций.
  • Изображения и видео: анализ изображений и видео позволяет определять объекты, лица, эмоции и другие характеристики, которые могут быть использованы в различных областях, таких как медицина, безопасность и т.д.

Кроме того, из неструктурированных данных можно извлечь много другой полезной информации в зависимости от контекста и задач, которые необходимо решать вашей организации.

— Как связаны аналитика неструктурированных данных, Интернет вещей, машинное обучение и искусственный интеллект?

— Аналитика неструктурированных данных, Интернет вещей (IoT), машинное обучение и искусственный интеллект — это технологии, которые тесно связаны друг с другом и могут использоваться вместе для решения сложных задач. IoT собирает данные с множества датчиков и устройств, таких как смартфоны, автомобили, домашние устройства и другие. Эти данные могут быть структурированными или неструктурированными. Аналитика неструктурированных данных позволяет анализировать такие данные, как тексты, изображения и видео, которые могут быть собраны с IoT-устройств. Машинное обучение и искусственный интеллект используются для обработки данных и создания аналитических моделей. Например, машинное обучение может использоваться для создания модели, которая поможет распознавать образы на фотографиях или анализировать тексты на естественном языке. А искусственный интеллект может использоваться для автоматического принятия решений на основе аналитических данных.

Комбинация этих технологий позволяет собирать, обрабатывать и анализировать данные с IoT-устройств, чтобы извлечь ценную информацию, с помощью которой можно будет оптимизировать бизнес-процессы. Например, в медицине IoT-устройства могут собирать данные о пациентах, а машинное обучение и искусственный интеллект могут использоваться для создания моделей, которые будут предсказывать риски заболеваний и рекомендовать лечение. Также подобная аналитика окажется очень полезна при мониторинге общественного здоровья и эпидемиологических ситуаций, в создании систем прогнозирования и моделирования распространения заболеваний. В производственной отрасли IoT-устройства могут собирать данные о производственных процессах, а аналитика неструктурированных данных, машинное обучение и искусственный интеллект могут использоваться для их оптимизации и уменьшения затрат.

— Вы привели примеры использования неструктурированных данных в медицине и на производстве. А как аналитика неструктурированных данных может помочь государственным учреждениям и другим отраслям?

— Аналитика неструктурированных данных может помочь различным секторам, включая и государственный сектор. Правительственные организации нуждаются в мониторинге и анализе социальных сетей и других медиаканалов для получения обратной связи от общества, определения общественного мнения и реакции на различные решения и действия правительства. Это поможет улучшить связь с обществом и предотвратить кризисы. В финансовом секторе аналитика неструктурированных данных может помочь банкам и другим финансовым организациям в анализе данных о клиентах, транзакциях и рынках для предсказания поведения клиентов, обнаружения мошенничества и прогнозирования рыночных трендов.

— Не могли бы вы вкратце рассказать о предложении Dell PowerScale?

— Dell PowerScale, ранее известная как платформа Dell Technologies Isilon, представляет собой ведущую в отрасли линейку горизонтально масштабируемых платформ сетевых систем хранения данных (NAS) для резервного копирования больших объемов хранилищ и архивирования неструктурированных данных. Наш пакет решений для хранения также предлагает несколько вариантов развертывания:

  • F-серия, полностью построенная на NVME дисках. Оптимальное решение для самых требовательных к производительности и случайных нагрузок приложений.
  • H-серия, предназначенная для потоковых нагрузок и предлагающая хороший баланс между емкостью и производительностью.
  • A-серия — модели для построения глубоких цифровых архивов.

Dell PowerScale работает на операционной системе OneFS с поддержкой лидирующих систем администрирования и оркестровки, таких как Ansible и Kubernetes, а также поддерживает весь спектр рабочих нагрузок корпоративных данных, от локальных до облачных, с помощью удобной горизонтально масштабируемой платформы. Более того, Dell PowerScale обеспечивает именно ту производительность, которую ожидают клиенты, в зависимости от различных рабочих нагрузок, будь то аналитика, цифровые медиа, здравоохранение, медико-биологические науки и т.д. Dell PowerScale не только позволяет организациям раскрыть потенциал своих неструктурированных данных, но и принимать лучшие бизнес-решения, что в конечном итоге повышает рентабельность инвестиций. Столь мощная платформа образует основу для хранения неструктурированных данных и программно-определяемой архитектуры, которая поможет нашим клиентам легко справляться с сегодняшними проблемами, не упуская из виду будущее.

Dell PowerScale

— Какими преимуществами могут воспользоваться заказчики в результате развертывания решений Dell PowerScale?

— Dell Technologies всегда была в авангарде предоставления своим клиентам лучших в своем классе инновационных технологий. Например, мы седьмой год подряд являемся лидером магического квадрата Gartner в области распределенных файловых систем и объектных хранилищ. И немалая заслуга в этом лидерстве принадлежит именно Dell PowerScale, как самого гибкого и безопасного горизонтально масштабируемого решения. Это современная инфраструктурная платформа, спроектированная и построенная «с нуля» с использованием передовых технологий и опыта для решения задач эпохи данных. Кроме того, наши заказчики могут развертывать Dell PowerScale в пограничных, основных и облачных средах, что позволяет организациям собирать данные в любом масштабе, где бы они ни генерировались. Это также позволяет компаниям оптимизировать свою инфраструктуру хранения за счет консолидации крупномасштабных неструктурированных данных, устраняя тем самым разрозненность хранилищ.

Dell PowerScale может начинаться с относительно небольших объемов и вырасти до огромных петабайтных масштабов, обеспечивая при этом как простоту развертывания, так и простоту использования. Его функции, в том числе масштабируемость без сбоев, интеллектуальная автоматизация, повышенная отказоустойчивость и эффективность, позволяют клиентам обрабатывать сотни терабайт неструктурированных данных без сбоев. Dell PowerScale также обеспечивает образцовый анализ наборов данных, помогая им соответствовать требованиям управления данными. Для предприятий, которые работают с фиксированными IТ-бюджетами, это решение является идеальным.

— Каким вы видите будущее обработки и анализа неструктурированных данных?

— Будущее обработки и анализа неструктурированных данных выглядит очень перспективным и динамичным. С каждым годом объем неструктурированных данных продолжает расти, а это означает, что разработчики и исследователи будут постоянно создавать новые инструменты и методы для работы с ними. Я приведу лишь некоторые тенденции, которые могут определить будущее обработки и анализа неструктурированных данных:

  • Интеграция машинного обучения и искусственного интеллекта: автоматическое обучение алгоритмов и использование нейронных сетей для обработки неструктурированных данных будет становиться все более распространенным. Это поможет улучшить качество и точность анализа данных.
  • Улучшение качества анализа: с развитием технологий и алгоритмов анализа мы можем ожидать, что производительность и точность анализа неструктурированных данных значительно улучшится. Это позволит сделать более точные выводы и принять более обоснованные решения на основе этих данных.
  • Развитие аналитики текста и обработки естественного языка: такие технологии, как машинный перевод и синтез речи, будут продолжать развиваться, что позволит улучшить обработку текстов и голосовых данных.
  • Использование больших данных: объем неструктурированных данных будет продолжать расти, и будут созданы новые методы обработки и анализа, чтобы работать с такими объемами данных.
  • Распространение использования в различных отраслях: технологии обработки и анализа неструктурированных данных будут все больше применяться в различных отраслях, включая медицину, финансы, правительство и другие, что позволит повысить эффективность работы в этих сферах.
  • Большее внимание к приватности данных: с увеличением количества данных, собираемых о пользователях, будет увеличиваться и внимание к вопросам защиты и приватности данных. Будут созданы новые инструменты и методы обработки данных, которые обеспечат большую безопасность и защиту данных.

 

НОВОСТИ ПО ТЕМЕ

СОЦИАЛЬНЫЕ СЕТИ

12,070ФанатыМне нравится
1,021ЧитателиЧитать
3,086ЧитателиЧитать
708ПодписчикиПодписаться
- Реклама -
- Реклама -
- Реклама -