Компания IBM представила серию больших языковых моделей (LLM) Granite, которые применяют генеративный искусственный интеллект для решения задач естественного языка и кодирования. Кроме того, в хранилище данных Watsonx появятся возможности генеративного искусственного интеллекта Watsonx.
Представленный в мае текущего года Watsonx представляет собой набор инструментов, помогающий корпоративным клиентам строить генеративные модели искусственного интеллекта, а также выполнять смежные задачи вроде адаптации нейросетей под требования безопасности. Новые модели будут доступны при посредничестве компонента watsonx.ai, который уже имеет готовые шаблоны.
Линейка моделей Granite включает LLM Granite.13b.instruct и Granite.13b.chat, построенные с помощью 2,4-терабайтного набора данных, подобранного специалистами компании. Модели способны составлять краткие резюме документов, извлекать информацию и генерировать тексты. Обе модели имеют по 13 млрд. параметров. Благодаря относительной компактности, для запуска любой из них достаточно единственного ускорителя NVIDIA V100, который значительно дешевле A100 и H100.
В компании отмечают, что готовятся и другие модели, а watsonx.ai, помимо наработок IBM, получит Llama-2 от Meta и нейросеть StarCoder, предназначенную для программистов. Также watsonx.ai получил механизм генерации синтетических данных, применяемых для обучения кастомных LLM, и инструмент для адаптации параметров нейросети для того, чтобы учить ее выполнять новые задачи без перетренировки.