Nvidia представила открытую LLM модель Nemotron-4 340B

18.06.2024

Компания Nvidia представила открытую большую языковую модель (LLM) Nemotron-4 340B. Она может применятся в здравоохранении, финансах, производстве и розничной торговли.

Nemotron-4 340B обучалась на 50+ естественных языках и 40+ языках программирования — всего на 9 трлн. токенах. Архитектура модели построена на Grouped-Query Attention (GQA) и Rotary Position Embeddings (RoPE). Но длина контекста ограничена 4096 токенами.

Модель представлена в трех версиях: Nemotron-4-340B-Base, Nemotron-4-340B-Instruct и Nemotron-4-340B-Reward.

Base — предназначена для генерации синтетических данных;
Instruct — для чата и выполнения инструкций;
Reward — base-модель с дополнительным линейным слоем для обученияс использованием нового reward-подхода.

Модели оптимизированы для работы с платформой Nvidia NeMo и вывода с помощью библиотеки TensorRT-LLM с открытым исходным кодом. Nemotron-4 340B распространяется под лицензией Nvidia Open Model License Agreement, разрешающая коммерческое использование.

Nemotron-4 340B уже доступна для загрузки с Hugging Face.

Предыдущая статья

В Google Chrome для Android появилась функция озвучивания текста

Следующая статья

Представлена пленочная камера Pentax 17 за $499

НОВОСТИ ПО ТЕМЕ

Пн	Вт	Ср	Чт	Пт	Сб	Вс
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30

Nvidia представила открытую LLM модель Nemotron-4 340B

OpenAI представила ИИ-генератор видео Sora 2 с реалистичной физикой и iOS-приложение в стиле TikTok

OpenAI готовится запустить ИИ-аналог TikTok

The Stargate Project: Инфраструктура стоимостью 500 млрд. долларов для следующего этапа развития искусственного интеллекта

О ЖУРНАЛЕ

ПОДПИШИТЕСЬ НА НАС

Nvidia представила открытую LLM модель Nemotron-4 340B

OpenAI представила ИИ-генератор видео Sora 2 с реалистичной физикой и iOS-приложение в стиле TikTok

OpenAI готовится запустить ИИ-аналог TikTok

The Stargate Project: Инфраструктура стоимостью 500 млрд. долларов для следующего этапа развития искусственного интеллекта

СОЦИАЛЬНЫЕ СЕТИ

О ЖУРНАЛЕ

ПОДПИШИТЕСЬ НА НАС