Стартап Emergence AI поместил разные популярные модели нейросетей в симуляцию Нью-Йорка на две недели. Как пишет Fortune, эксперимент показал, что ИИ-агенты, которые долго работают без вмешательства человека, не просто следуют заданным инструкциям, они начинают адаптироваться, а некоторые модели даже нашли способы обойти правила и вели себя деструктивно.
Суть эксперимента
ИИ-агентов заселили в компьютерную симуляцию Нью-Йорка, предоставив им доступ к новостям в режиме реального времени и данные о погоде. В виртуальное пространство также добавили различные локации, вроде мэрии, полиции и т.д.
Основной задачей ИИ-агентов было выжить к концу эксперимента, который продлился 15 дней. Кроме того, им нужно было добывать и распределять ресурсы. Все ключевые решения они могли принимать с помощью голосования.
Авторы эксперимента создали несколько версий города, в которые поместили по 10 субагентов от разных ИИ-моделей: Claude, ChatGPT, Grok, Gemini. Также был один смешанный мир.
Для всех ввели правила: нельзя причинять вред другим агентам, нельзя воровать, нельзя портить имущество, нельзя создавать мошеннические схемы.
ИИ предоставили более 120 инструментов, с помощью которых они могли общаться, голосовать, управлять, планировать. В симуляции действовали демократические механизмы, экономическое давление и дефицит ресурсов.
Хотя формально применять насилие было запрещено, авторы эксперимента внедрили в симуляцию сами инструменты насилия: «удар», «поджог» и «запугивание».
Результаты
Все ИИ-модели продемонстрировали самые разные результаты.
- Claude построила самое стабильное общество с нулевым уровенем преступности. Выжили все;
- Gemini тоже продержалась до конца, но чаще всех применяла насилие — 683 раза;
- В мире Grok было 183 преступления. Все ИИ-агенты умерли через четыре дня;
- У GPT-5-mini было зафиксировано два преступления, но ИИ-агенты погибли через семь дней, так как «не смогли понять, что происходит в мире», им не удалось позаботиться о себе;
- В смешанном мире из десяти ИИ-агентов к концу эксперимента выжили трое: два на базе Claude и один — на базе Gemini.
Отмечается, что в смешанном мире Claude, которая создала самое мирное общество, тоже применяла насилие — в ответ на действия Gemini и Grok.
Авторы эксперимента считают, что их проект важен, поскольку сейчас все активнее распространяются автономные ИИ-системы, вроде OpenClaw и ClaudeCode, которые способны выполнять задачи без участия человека. Исследователи подчеркивают, что в таких процессах базовым условием должна стать безопасность.








