Компания Google представила третье поколение малой языковой модели с открытым исходным кодом Gemma, оптимизированной для работы на устройствах с ограниченными ресурсами — смартфонах, ноутбуках и серверах с базовыми GPU. Благодаря поддержке более чем 140 языков, Gemma 3 может использоваться по всему миру.
В основе Gemma 3 лежат те же исследования и технологии, что и в Gemini 2.0. Новая модель доступна в четырех вариантах: 1B, 4B, 12B и 27B параметров. Главное улучшение — увеличение контекстного окна до 128 тысяч токенов против 80 тысяч у Gemma 2. Это позволяет обрабатывать более объемные запросы и сложные сценарии. Gemma 3 поддерживает мультимодальный анализ текста, изображений и коротких видео, а также автоматизацию задач через вызов функций.
Google охарактеризовал Gemma 3 как «лучшую в мире модель для одного ускорителя», она предлагает самую высокую производительность для своих размеров, превосходя Llama-405B, DeepSeek-V3 и o3-mini. В тестах Chatbot Arena Elo версия 27B заняла второе место после DeepSeek-R1, обойдя Mistral Large и Claude 3.7 Sonnet.
В Gemma 3 встроен ShieldGemma 2 — 4B-параметровый фильтр изображений, блокирующий генерацию контента с насилием, сексуальными сценами и другими нарушениями. Система допускает кастомизацию под нужды пользователей. В Google отметили, что при обучении модели использовались строгие правила обработки данных, тонкая настройка в соответствии с политиками безопасности и тесты на риски.
Разработчики могут интегрировать Gemma 3 через инструменты Hugging Face Transformers, Ollama, PyTorch, JAX и Keras, а также через Google AI Studio, Hugging Face или Kaggle. Для корпоративных клиентов доступен запрос к API модели через AI Studio.