Компания ElevenLabs представила инструмент на базе генеративного ИИ под названием AI Sound Effects, который способен генерировать по текстовому запросу различные звуковые эффекты.
ElevenLabs уже предлагает пользователям созданные с помощью ИИ версии человеческих голосов для озвучивания текстов и исполнения музыки. Новый инструмент поможет создавать звуковые эффекты для подкастов, фильмов или игр. ElevenLabs заявила, что использовала аудиотеку Shutterstock, содержащую лицензионные треки, в качестве инструмента для обучения своей модели.
Сервис генерирует звуки продолжительностью до 22 секунд на основе подсказок пользователя, их можно комбинировать с голосовой и музыкальной платформой компании. Он предоставляет как минимум четыре варианта загружаемых аудиоклипов.
Инструмент позволяет вводить такие подсказки, как «разбивающиеся волны», «лязг металла», «щебетание птиц», «двигатель гоночного автомобиля» и т.д., для генерирования фрагментов звуков.
Есть бесплатная и платная версии. При бесплатном доступе будет установлен лимит в 10 тысяч символов, пользователь обязан ссылаться при публикации клипа на ElevenLabs, добавив в заголовок elevenlabs.io. При создании звуковых эффектов будет взиматься 40 символов за секунду аудио. По умолчанию каждый запрос будет стоить 200 символов. При платном доступе пользователи получают коммерческую лицензию на свободное использование сгенерированных клипов.