IBM представляет базовые модели генеративного искусственного интеллекта Granite

08.09.2023

Компания IBM представила серию больших языковых моделей (LLM) Granite, которые применяют генеративный искусственный интеллект для решения задач естественного языка и кодирования. Кроме того, в хранилище данных Watsonx появятся возможности генеративного искусственного интеллекта Watsonx.

Представленный в мае текущего года Watsonx представляет собой набор инструментов, помогающий корпоративным клиентам строить генеративные модели искусственного интеллекта, а также выполнять смежные задачи вроде адаптации нейросетей под требования безопасности. Новые модели будут доступны при посредничестве компонента watsonx.ai, который уже имеет готовые шаблоны.

Линейка моделей Granite включает LLM Granite.13b.instruct и Granite.13b.chat, построенные с помощью 2,4-терабайтного набора данных, подобранного специалистами компании. Модели способны составлять краткие резюме документов, извлекать информацию и генерировать тексты. Обе модели имеют по 13 млрд. параметров. Благодаря относительной компактности, для запуска любой из них достаточно единственного ускорителя NVIDIA V100, который значительно дешевле A100 и H100.

В компании отмечают, что готовятся и другие модели, а watsonx.ai, помимо наработок IBM, получит Llama-2 от Meta и нейросеть StarCoder, предназначенную для программистов. Также watsonx.ai получил механизм генерации синтетических данных, применяемых для обучения кастомных LLM, и инструмент для адаптации параметров нейросети для того, чтобы учить ее выполнять новые задачи без перетренировки.

Предыдущая статья

BMW отменил спорную подписку на подогрев сидений

Следующая статья

Apple купила права на экранизацию книги о сооснователе FTX

НОВОСТИ ПО ТЕМЕ

Пн	Вт	Ср	Чт	Пт	Сб	Вс
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30

IBM представляет базовые модели генеративного искусственного интеллекта Granite

Rəsmi sənədlərdə fərqli mövqe: Microsoft Copilot-u “iş aləti” hesab etmir

Microsoft представил три ИИ-модели для генерации текста, голоса и изображений

Alibaba-nın yeni AI modeli Qwen 3.5-Omni video dərsliklərdən istifadə edərək kod yaza bilir

О ЖУРНАЛЕ

ПОДПИШИТЕСЬ НА НАС

IBM представляет базовые модели генеративного искусственного интеллекта Granite

Rəsmi sənədlərdə fərqli mövqe: Microsoft Copilot-u “iş aləti” hesab etmir

Microsoft представил три ИИ-модели для генерации текста, голоса и изображений

Alibaba-nın yeni AI modeli Qwen 3.5-Omni video dərsliklərdən istifadə edərək kod yaza bilir

СОЦИАЛЬНЫЕ СЕТИ

О ЖУРНАЛЕ

ПОДПИШИТЕСЬ НА НАС