Компания Boston Dynamics использовала чат-бота ChatGPT от OpenAI, а также некоторые другие ИИ-модели для обучения своего роботизированного пса Spot человеческой речи. Теперь робот проводит экскурсию по помещениям компании, отвечая на вопросы туристов.
Также разработчики оснастили Spot динамиком, микрофоном, добавили роботизированный манипулятор, на котором закрепили небольшой головной убор и пару пластиковых глаз.
Команда предоставила Spot краткий сценарий для каждой комнаты на своих объектах. Затем робот объединил этот сценарий с изображениями, которые он получает со своих камер, что позволило ему получить больше информации о том, что он видит, прежде чем сгенерировать ответ. По данным компании, Spot использует модели визуальных ответов на вопросы для описания изображений и ответов на вопросы о них.
Роботу предложили проводить экскурсии от имени разных персонажей: гида-британца времен Шекспира, девочки-подростка и саркастичного Джоша (Josh). Spot говорил людям комплименты, на ходу сочинял стихи и успешно отвечал на вопросы, которых даже не было в сценарии.
Но произошло и неожиданное: когда его попросили показать родителей, они привел посетителя к выставленным роботам Spot предыдущего поколения. Разумеется, не обошлось и без сбоев: иногда робот говорил не соответствующие действительности вещи, в другой раз проигнорировал реплику собеседника, продолжил свой рассказ и отреагировал лишь спустя какое-то время.