Исследователи из MIT использовали сюжеты 360 фильмов для того, чтобы обучить искусственный интеллект писать сценарии, но затем обнаружили, что научить его шутить и быть смешным сложно.
Алгоритм, который использовали исследователи, называется textgenrnn. Он имеет два режима: ученые могут использовать буквы для генерации слов в стиле других слов или использовать слова для генерации предложений в стиле других предложений.
Каждый режим с одинаковыми настройками, которые можно изменить, чтобы добиться хороших результатов. В этом случае исследователи сосредоточились на трех показателях — количестве слоев, времени и креативности.
Слои относятся к сложности нейронной сети: чем больше у нее слоев, тем сложнее данные, с которыми она может работать. Количество времени — минуты, которые получает алгоритм, чтобы посмотреть на тренировочные данные, прежде чем выдать окончательные результаты. В случае низкой креативности сеть будет выбирать общие слова в наборе обучающих данных по сравнению с теми, которые появляются редко.
Среди синопсисов, которые предложил алгоритм, были такие: «Мужчина возвращается к певцу, который вынужден вернуть свою жизнь вместе с парой, чтобы помочь дочери на Рождество», «Одинокая курьерская деревенская газета на родине уничтожает Рождество, Рождество и Рождество», «Няня мальчик пытается праздновать Рождество в течение более Рождества». Названия фильмов же были «Рождественская миля», «IT-санта» и «Гранж-рождество».
Частично проблема связана с небольшим набором данных. 360 сюжетов — это слишком мало, обычно для тренировки нужны миллионы текстов. Также это связано с textgenrnn — алгоритм не очень хорош при построении предложений по сравнению с альтернативами. Она ограничена в генерировании предложений с помощью нейронной сети, сообщает hightech.fm.