Amazon Transcribe – это сервис AWS на основе искусственного интеллекта, позволяющий преобразовывать речь в текст. ASR или полностью управляемый сервис автоматического распознавания речи позволяет добавлять подобный функционал в приложения. Теперь у системы есть возможность распознавать речь более чем 100 языков, включая азербайджанский, сообщает bluescreen.kz.
Что такое Amazon Transcribe?
Благодаря технологии автоматического распознавания речи (ASR) компании могут использовать Amazon Transcribe для решения самых разных бизнес-задач, включая расшифровку телефонных обращений в службу поддержки, создание субтитров для аудио- и видеоконтента, а также текстового анализа аудио- и видеоконтента.
Модель Transcribe обучена с помощью лучших в своем роде алгоритмов для изучения присущих человеческой речи универсальных паттернов для разных языков и акцентов.
«Живой аудиоперевод Carbyne с поддержкой искусственного интеллекта напрямую направлен на улучшение реагирования на чрезвычайные ситуации для 68 млн американцев, говорящих дома не на английском языке, а также для 79 млн иностранных гостей, посещающих страну ежегодно. Благодаря использованию новой модели многоязычного фонда Amazon Transcribe на базе ASR компания Carbyne получит еще больше возможностей для демократизации жизненно важных служб экстренной помощи, потому что каждый человек имеет значение», – делится Алекс Дизенгоф, сооснователь и технический директор компании Carbyne (разработчики облачных решений для контакт-центров).
Так, при работе с телефонной речью, которая является сложной областью, новая речевая модель повысила точность от 30% до 70%. Кроме того, большая ASR-модель обеспечивает улучшение читабельности за счет более точной пунктуации. Расширенная поддержка различных акцентов, шумового окружения и акустических условий позволяет получать более точные результаты и тем самым эффективно внедрять голосовые технологии в свои приложения.
Благодаря высокой точности Amazon Transcribe, поддержке большого количества языков и широкому набору дополнительных функций тысячи предприятий получат возможность извлекать из аудиоконтента больше полезной информации, а также повышать доступность аудио- и видеоконтента в различных областях. Например, контакт-центры смогут расшифровывать и анализировать звонки клиентов, чтобы выявить важные моменты и впоследствии повысить качество обслуживания и производительность труда агентов. Производители контента и медиадистрибьюторы автоматически генерируют субтитры с помощью Amazon Transcribe для повышения доступности контента.
Подробнее о начале работы с Amazon Transcribe и как технически работает языковая модель, читайте в статье.