Технологии искусственного интеллекта (ИИ) постепенно становятся обязательными во многих сферах бизнеса, а разработчики предлагают все более интересные решения. Одна из перспективных технологий, в которой используется ИИ сегодня, — это голосовые роботы, которые распознают речь собеседника и отвечают на часто задаваемые вопросы. Во многих странах мира голосовые роботы выступают в качестве необходимого инструмента для первичной консультации, уведомлений, подтверждений, проведения опросов и дальнейшей маршрутизации запросов клиентов. При этом система с ИИ распознает вопрос, даже если он построен не по шаблону, подбирает ответ с учетом контекста, а также может убедительно имитировать живой диалог и человеческий голос. Такие системы в состоянии поддерживать тысячи диалогов одновременно и ощутимо разгружают call-центр, значительно сокращая время ожидания ответа. Согласно прогнозу исследовательского агентства Juniper Research, к 2023 году голосовые и чат-боты сэкономят клиентам и компаниям более 2,5 млрд. часов. И это только в сферах банкинга, ритейла и здравоохранения.
Одним из лидеров в области речевых технологий, построенных на базе ИИ, является греческая компания Omilia — разработчик голосовой системы интеллектуального распознавания естественной речи. В решении компании на базе платформы Omilia DiaManT используются алгоритмы, основанные на работе нейронных сетей, что позволяет достичь понимания запросов клиентов на уровне человека. Компания реализовала множество успешных проектов в более чем 15 странах мира, включая страны нашего региона, а сейчас вместе со своим официальным партнером в Азербайджане в лице компании iTech Group готовится к внедрению этого решения в одной из крупнейших компаний нашей страны. О перспективах внедрения технологий Omilia в интервью Infocity рассказывает директор по развитию бизнеса компании iTech Group Ровшан Акбаров.
— Ровшан, в прошлый раз мы говорили с вами на тему кибербезопасности, но развитие ИИ представляет не меньший интерес. И одним из трендов в этой сфере, безусловно, являются технологии, подразумевающие обработку голоса. Как сильно в этом направлении продвинулась компания Omilia и с какими задачами сегодня справляются технологии этой компании?
— Если коротко, то эти технологии позволяют серьезно сэкономить и при этом повысить качество обслуживания в call-центрах. Например, банки, телекоммуникационные компании и государственные организации ежедневно обрабатывают огромное количество запросов, при том что основная их часть — это типовые обращения. Операторы call-центров отвечают на такие обращения по стандартному протоколу, что может делать и голосовой робот. В то же время человек получит больше времени на обработку специфичных вопросов и консультирование приоритетных клиентов. Представьте ситуацию, когда вы позвонили в банк, но попали не в меню традиционного IVR, где необходимо выбрать нужную услугу из длинного списка или дождаться соединения с оператором, а вас поприветствовал голосовой робот с высоким уровнем распознавания речи от Omilia. Он может не только идентифицировать клиента и понять вопрос, но и самостоятельно озвучить информацию по запросу или перенаправить на нужного специалиста. Данная технология также может полностью заменить операторов при сборе обратной связи от клиентов.
В голосовой системе интеллектуального распознавания речи компании Omilia в ходе обслуживания клиента предусмотрен только один открытый вопрос — какая информация его интересует. В дальнейшем она воспринимает ответы абонентов в свободной форме с точностью более 95% и ведет живой неструктурированный диалог. Использование этой технологии позволит существенно снизить расходы на содержание call-центров, так как голосовой робот будет отвечать на запросы клиентов без перерывов и выходных, ускорит сбор данных и донесение информации до клиентов, а также значительно увеличит показатели удержания клиентов. И есть все основания полагать, что распространение голосовых роботов — это лишь начало фундаментального тренда на использование ИИ в нашей стране.
— Но в каждой стране существуют собственные диалекты и множество вариантов того, как люди используют речь, чтобы задавать вопросы и взаимодействовать. Насколько известно, в Азербайджане пока нет собственной языковой модели для ИИ…
— У каждой страны разные уровни зрелости технологий, а создание языковой модели сопряжено с массой сопутствующих факторов, среди которых разнообразие диалектов является лишь одним из немногих. Первая и главная задача разработчиков — собрать качественную структурированную информацию для обучения языковой модели. Кроме того, что сбор столь обширной голосовой базы данных реально могут осуществить в Азербайджане не столь много компаний, создание модели усложняется и тем, что нет общепринятых стандартов, по которым можно было бы измерять качество. Но тем не менее азербайджанская языковая модель должна быть готова ближе к концу этого года, что позволит проявить все возможности решений Omilia, которые прекрасно натренированы под конкретные задачи ИИ практически для всех возможных сценариев работы. И я уверен, что создание языковой модели в Азербайджане окажет большую помощь не только в развитии голосовых технологий, но будет полезно и в множестве других сервисов, например, ускорит выдачу ответов в поисковых системах, улучшит качество переводов, создаст возможность оценки содержания постов в социальных сетях и т.д. К тому же, языковая модель поможет и развитию проектов локальных разработчиков, которые сегодня делают довольно смелые и продуктивные шаги в направлении создания голосовых роботов.
— Некоторые компании гордятся тем, что не используют в своей работе ботов, а с клиентами общаются только настоящие люди. Насколько неверным сегодня является подобный подход к построению работы call-центров?
— Как на каждом предприятии есть масса повторяющихся задач, так в каждом call-центре существует и масса типовых шаблонов ответов. В то же время мы, обращаясь в call-центр, не всегда бываем рады долгому ожиданию ответа оператора, особенно если нужно быстро получить довольно простой и односложный ответ. К тому же, какой-то оператор может быть просто без настроения, уставшим или попросту некомпетентным, что тоже не добавит радости общению с ним. Безусловно, многие клиенты пока не доверяют полностью автоматизированным системам, предполагая, что они не поймут их вопроса, но порог понимания таких систем растет с каждым днем. Тренируются все более и более сложные модели, способные вести себя настолько естественно, что в конце общения клиенты, особенно пожилые, благодарят голосового робота, приняв его ответы за речь настоящего человека.
И самое главное, что такие технологии сегодня доступны не только крупномасштабным предприятиям, но и компаниям с небольшим штатом сотрудников. И это тоже напрямую связано со зрелостью технологий. Свои решения Omilia начинала имплементировать у крупных клиентов в Северной Америке еще в 2015 году, и тогда это были многоуровневые проекты, реализация которых занимала от 12 до 18 месяцев и обходились в несколько сотен тысяч долларов. Сегодня все совсем по-другому, потому что технологии Omilia внедрены на массе крупных предприятий, компания обучила модели для каждой отрасли, так что ей не нужно делать это снова, как только появляется новый клиент. Теперь технология настолько отточена, что разработчик делает ее доступной прямо «из коробки» с собственной облачной платформы для компаний любого размера. Для Omilia не имеет значения, будет у вас пять клиентских запросов в день или тысячи, вы все равно сможете извлечь выгоду из использования этой технологии.
— У большинства компаний есть своя собственная инфраструктура для поддержки клиентов. Насколько легко в нее интегрируется решение Omilia? Зависит ли решение от инфраструктуры или клиенты могут использовать его где угодно?
— Для Omilia не имеет значения, какая у заказчика используется инфраструктура. iTech Group, как интегратор и официальный партнер Omilia в Азербайджане, может развернуть решение как локально, так и на облаке для самых разных пользователей. Эта компания стремится предоставить технологии, которые требуют минимум усилий по имплементации, которые не заставят интегратора привлекать команды разработчиков для последующей шлифовки решения. И что самое главное, решение может быть поставлено уже сегодня. Оно настолько просто в эксплуатации, что в портфолио компании есть даже примеры, когда заказчики самостоятельно разворачивали дополнительные модули для нужд своей компании. Это радует, так как является подтверждением того, что у Omilia действительно есть технология, отшлифованная до такого уровня, когда клиенты могут использовать ее сами. А это очень серьезная тема разговорного ИИ, потому что на рынке голосовых систем много хайпа. Здесь слишком много предложений и очень много клиентов, которые пользуются услугами достаточно известных производителей, но при попытке создать что-то, что будет удовлетворять их потребностям, не испытывают ничего, кроме разочарования. Omilia же дает простор для фантазии, широкий спектр возможностей для добавления новых модулей и сценариев.
— С развитием подобных систем можно только догадываться о том, какое будущее нас ожидает?
— На самом деле, «сырыми» подобные технологии уже назвать нельзя, но сейчас идут работы над распознаванием эмоций и эмоциональной окраски каждого отдельно сказанного слова, более тесная интеграция с видеозвонками и определение личности, запроса и настроения по лицу и движению губ. Развиваются и биометрические технологии, узнающие пользователя по голосу. И в ближайшем будущем они станут настолько безупречными в использовании, что смогут избавить людей от рутинной работы, выполнять различные задачи лучше, быстрее и эффективнее.
За дополнительной информацией, связанной с вопросами реализации решений Omilia, обращайтесь в компанию iTech Group.
(+99412) 310 1414 | https://www.itechgroup.az/