Согласно недавнему отчёту IBM, разработчикам компании удалось добиться значительного снижения коэффициента ошибок в процессе компьютерного распознавания речи. Показатель составил 5,5%, тогда как предыдущий результат равнялся 6,9%. Стоит отметить, что IBM смогла побить не только собственный рекорд, но и обойти Microsoft: в октябре прошлого года последняя сообщила об уменьшении доли ошибок до 5,9%. Ожидается, что в обозримом будущем достижение IBM позволит в несколько раз улучшить работу виртуальных помощников Siri и Alexa.
Объявив о своих успехах в октябре 2016 года, Microsoft полагала, что её показатель ошибок в 5,9% технологии машинного распознавании речи не так уж и далёк от человеческого. Однако IBM считает иначе, сообщает 4pda.ru.
«На данном этапе исследования мы выяснили, что процентное соотношение распознавания речи человеком в сравнении с компьютером на самом деле ниже, и к этому результату — 5,1% — ещё никто не приблизился» — сообщил главный научный сотрудник IBM Джордж Саон в своём блоге.
Этим заявлением IBM установила новую планку, к которой будет стремиться сама, и подстёгивать достигнутыми результатами конкурентов. Тем не менее для того, чтобы сравнять в этом плане компьютер и человека, придётся серьёзно потрудиться и учесть множество нюансов.
«Способность распознавать речь так, как делает это человек — серьёзный вызов, поскольку определение беглой речь, особенно во время спонтанного разговора, является чрезвычайно сложной задачей, — сказала Джулия Хиршберг, профессор и заведующий кафедрой компьютерных наук Колумбийского университета. — Сложность заключается ещё и в том, что способность людей распознавать и понимать речь других зависит от индивидуальности».