ИИ-модель Fugatto от Nvidia «понимает и генерирует звук, как это делают люди»

26.11.2024

Компания Nvidia представила новую генеративную ИИ-модель под названием Fugatto (Foundational Generative Audio Transformer Opus 1), которая использует текстовые подсказки для генерации новых или изменения существующих музыкальных, голосовых и звуковых файлов.

Разработчики описывают Fugatto как «швейцарский армейский нож для звука». В создании ИИ-модели принимали участие разработчики со всего мира. «Мы хотели создать модель, которая понимает и генерирует звук, как это делают люди», — рассказал участник проекта и менеджер по прикладным исследованиям звука в Nvidia Рафаэль Валле (Rafael Valle).

Nvidia выделила несколько сценариев, в которых Fugatto может быть полезна:

Музыкальным продюсерам в создании прототипа песен с их дальнейшим редактированием;
При создании аудиоматериалов для изучения языка;
Разработчикам видеоигр для озвучки персонажей в зависимости от действий геймера.

Кроме того, разработчики утверждают, что модель при некоторой дополнительной тонкой настройке может выполнять задачи, не входившие в ее предварительное обучение. В частности, Fugatto способна объединять различные инструкции, например, генерировать речь с определенными интонациями и акцентом или звук пения птиц во время грозы. Модель также умеет генерировать изменяющиеся со временем звуки, например, шум приближающегося ливня или удаляющегося поезда.

Пока что Nvidia не предоставила публичный доступ к Fugatto.

Предыдущая статья

Эксперты Kaspersky ICS CERT обнаружили критические уязвимости в чипах Unisoc

Следующая статья

Опубликован новый трейлер фильма «Соник 3»

НОВОСТИ ПО ТЕМЕ

Пн	Вт	Ср	Чт	Пт	Сб	Вс
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30

ИИ-модель Fugatto от Nvidia «понимает и генерирует звук, как это делают люди»

В Китае выпустили крупнейшую в мире открытую ИИ-модель Kimi K3 с 2,8 трлн. параметров

ChatGPT axtarışı yeniləndi – çatlar, sənədlər və şəkillər artıq bir yerdədir

İlon Mask SuperGrok Heavy abunəçilərinə X Premium+ hədiyyə etdi

О ЖУРНАЛЕ

ПОДПИШИТЕСЬ НА НАС

ИИ-модель Fugatto от Nvidia «понимает и генерирует звук, как это делают люди»

В Китае выпустили крупнейшую в мире открытую ИИ-модель Kimi K3 с 2,8 трлн. параметров

ChatGPT axtarışı yeniləndi – çatlar, sənədlər və şəkillər artıq bir yerdədir

İlon Mask SuperGrok Heavy abunəçilərinə X Premium+ hədiyyə etdi

СОЦИАЛЬНЫЕ СЕТИ

О ЖУРНАЛЕ

ПОДПИШИТЕСЬ НА НАС