Google AI имитирует Doom 1993 года в реальном времени без какого-либо игрового движка

Мир видеоигр вот-вот изменится навсегда.
На этой неделе исследователи из Google и Тель-Авивского университета представили GameNGen , новую модель искусственного интеллекта, которая может интерактивно моделировать классическую видеоигру Doom 1993 года в реальном времени, используя методы визуализации на основе искусственного интеллекта, заимствованные из Stable Diffusion. Это система нейронных сетей, которая может функционировать как ограниченный игровой движок, потенциально открывая новые возможности для синтеза видеоигр в реальном времени в будущем. Например, вместо рисования графических видеокадров с использованием традиционных методов будущие игры могут использовать механизм искусственного интеллекта для «воображения» или создания графики в реальном времени в качестве задачи прогнозирования. «Потенциал здесь невероятен», — написал в ответ на эту новость разработчик приложения Ник Добос. «Зачем писать сложные правила для программного обеспечения вручную, если ИИ может представить за вас каждый пиксель?»
Сообщается, что GameNGen может генерировать новые кадры игрового процесса Doom со скоростью более 20 кадров в секунду, используя тензорный процессор (TPU) — тип специализированного процессора, похожего на графический процессор, — оптимизированный для задач машинного обучения. Исследователи говорят, что в ходе тестирования десять человек-тестеров иногда не могли отличить короткие отрывки (1,6 и 3,2 секунды) реального игрового процесса Doom от роликов, созданных GameNGen, и идентифицировали оригинальные кадры только в 58–60 процентах случаев.
Следует отметить, что синтез видеоигр в реальном времени с использованием так называемого «нейронного рендеринга» не является совершенно новой идеей.
Генеральный директор Nvidia Дженсен Хуанг предсказал в мартовском интервью, возможно, несколько смело, что большая часть графики видеоигр может быть создана с помощью ИИ в реальном времени в течение пяти-десяти лет.
GameNGen также опирается на предыдущие работы в этой области, включая World Models в 2018 году, GameGAN в 2020 году и собственный Genie от Google в марте. Кроме того, в начале этого года группа университетских исследователей обучила модель искусственного интеллекта (под названием DIAMOND) симулировать старые видеоигры Atari с использованием диффузионной модели.
отя текущая реализация сосредоточена на моделировании Doom, игры с относительно простой графикой по сегодняшним меркам, GameNGen предполагает, что в будущих итерациях технологии могут быть доступны более сложные игры и симуляции. Поскольку модели искусственного интеллекта продолжают развиваться, а стоимость вычислений снижается, мы можем увидеть все более сложные нейронные игровые движки, способные генерировать большие, согласованные интерактивные миры в реальном времени.
Это также фундаментально изменит способ создания видеоигр. «Сегодня видеоигры программируются людьми», — пишут исследователи в своей статье.
«GameNGen — это подтверждение концепции части новой парадигмы, в которой игры являются параметрами нейронной модели, а не строк кода».

Исследователи предполагают, что с помощью этого метода новые видеоигры можно будет создавать «с помощью текстовых описаний или примеров изображений», а не с помощью программирования, и люди смогут превратить набор неподвижных изображений в новый игровой уровень или персонажа для существующей игры. на примерах навыки программирования не требуются.
На данный момент это все чистые спекуляции. А пока нам придется подождать и посмотреть, куда пойдут исследования и как эти новые методы можно будет применить к интерактивным видеоиграм в будущем.