Yandex Cloud разработал нейросеть на базе машинного обучения, которая умеет распознавать более 10 иностранных языков одновременно. С помощью новой нейросети компании смогут проще и быстрее создавать многоязычных голосовых помощников и мультиязычных голосовых роботов для колл-центров с большим потоком клиентов.
Нейросеть-полиглот умеет работать и с популярными языками, такими как английский и французский, и с более редкими — датским, финским, турецким. Модель распознает речь на любую тему и в разных форматах: короткие и длинные фразы, а также имена, адреса, даты и числа. Она умеет распознавать язык автоматически в одном потоке: нейросеть может в любой момент переключаться между языками. Такая функция может пригодиться при деловых переговорах. При этом есть возможность давать ей «подсказки», чтобы улучшить качество распознавания.
Новая мультиязычная модель работает на базе архитектуры Transformer, обрабатывающей входящие слова параллельно независимо друг от друга для увеличения скорости обучения. Чтобы при переходе на другой язык текст получался связным и грамматически правильным, нейросеть обучали на десятках терабайтов данных из профессиональных датасетов и массивах данных из сервисов и приложений Яндекса.
Новое мультиязычное распознавание уже доступно для пользователей сервиса Yandex SpeechKit.
Следите за новостями в нашем Telegram-канале: https://t.me/infocity_az