spot_img
5 июня, 2026
ДомойAI / MLGoogle выпустил мультимодальную ИИ-модель Gemma 4 12B, которая локально запускается на ноутбуке

Google выпустил мультимодальную ИИ-модель Gemma 4 12B, которая локально запускается на ноутбуке

Компания Google представила мультимодальную ИИ-модель Gemma 4 12B, которая рассчитана на локальный запуск на ноутбуках и других устройствах с ограниченными вычислительными ресурсами. Как сообщается в блоге компании, модель позиционируется как промежуточное звено между базовой версией E4B и более продвинутой моделью 26B, базирующейся на архитектуре Mixture of Experts (MoE).

Разработчики заявляют, что система способна работать без традиционных отдельных энкодеров для обработки изображений и аудио. В Gemma 4 12B данные обрабатываются напрямую, благодаря чему уменьшаются время задержки и требования к объему памяти.

В случае обработки изображений отдельный vision-энкодер заменен легким модулем на основе матричных преобразований и позиционного кодирования, что снижает вычислительные затраты. Что касается аудио, то этот процесс был дополнительно упрощен путем полного удаления аудиоэнкодера и проецирования необработанного сигнала в единое пространство с текстовыми токенами.

Несмотря на упрощенную архитектуру, Gemma 4 12B демонстрирует производительность, близкую к более крупной модели с 26 млрд. параметров на стандартных бенчмарках. При этом ее требования к памяти существенно ниже, что позволяет запускать систему локально на устройствах с 16 Gb видеопамяти или унифицированной памяти. Вдобавок модель может становиться основой для ИИ-агентов, поскольку умеет вызывать внешние функции.

В числе других особенностей — контекстное окно в 256 тыс. токенов, режим пошагового размышления и свободная лицензия Apache 2.0. Модель также поддерживает механизм Multi-Token Prediction (MTP), который снижает задержки при генерации текста, и ориентирована на агентные сценарии использования, включая выполнение сложных задач.

Согласно внутренним тестам Google, Gemma 4 12B набирает 77,2% в бенчмарке MLU Pro и 78,8% в GPQA Diamond. Новая LLM уже доступна на платформах Hugging Face, Ollama, Kaggle, Google AI Edge Eloquent и LM Studio.

Google отмечает, что линейка Gemma уже достигла более 150 млн. загрузок в сообществе разработчиков. На ее основе создавались различные проекты — от носимых роботизированных систем до корпоративных решений в области кибербезопасности.

НОВОСТИ ПО ТЕМЕ

СОЦИАЛЬНЫЕ СЕТИ

11,766ФанатыМне нравится
1,009ЧитателиЧитать
3,086ЧитателиЧитать
719ПодписчикиПодписаться
- Реклама -
- Реклама -
- Реклама -