Компания Google создала новый алгоритм, способный перевести речь пользователя на другой язык, не искажая голос говорящего.
Об этом крупнейшая IT-компания рассказала в своем блоге. Алгоритм называется Translatotron. Вместо того, чтобы сначала делать из речи текст, потом переводить его на другой язык, а уже после этого заново озвучивать, искусственный интеллект обрабатывает напрямую голосовой ввод. Алгоритм воспринимает запись голоса как спектрограмму и генерирует на ее основе новую спектрограмму на нужном языке.
Прослушать образцы звучания переводов Translatotron можно на страничке проекта на GitHub.
В Google утверждают, что новый метод перевода намного точнее базового и лучше обрабатывает имена собственные. Генерируемая речь по-прежнему звучит немного механически, но в целом похожа на речь говорящего, сообщает ferra.ru.