Компания IBM называет Data Asset eXchange (DAX) уникальным проектом для корпоративных клиентов, несмотря на присутствие в интернете (например, на GitHub) большого количества открытых массивов данных.
Как заявляют в IBM, DAX является коллекцией «тщательно отобранных бесплатных и открытых наборов данных», которые поставляются с «четко определенными лицензиями». Все записи и метаданные представлены в стандартизированном формате, поэтому их проще использовать для тренировки алгоритмов машинного обучения и искусственного интеллекта.
Аналитик Даг Хеншен (Doug Henschen) из Constellation Research сообщил изданию SiliconANGLE о том, что наборы данных, предлагаемые IBM, все же должны быть проверены разработчиками, поскольку им нужно убедиться в соответствии определенным средам. В целом эксперт похвалил данный проект.
«Приятно слышать, что эти источники данных специально отобраны, открыты, стандартизированы с точки зрения форматов и метаданных, а также адресованы определенным отраслям. В этом их ценность, особенно на ранней стадии разработки приложений», — сказал Хеншен.
В репозитории DAX можно встретить уникальные массивы данных, которыми пользуются в IBM и IBM Research: например, Finance Proposition Bank и Contracts Proposition Bank.
IBM позиционирует DAX как дополнение к хранилищу IBM Model Asset eXchange (MAX), в котором специалисты по обработке данных и разработчики могут получить бесплатные модели машинного и глубокого обучения с открытым исходным кодом.
IBM хочет облегчить использование данных DAX и MAX в сочетании со своими ИИ-продуктами, а также гибридными и многооблачными инструментами, говорится в блоге компании, сообщает tadviser.ru.