
Що відомо про Genie 3 — нейромережу, яка може назавжди змінити ігрову індустрію
На днях Google DeepMind представила нову версію Genie — модель генерації віртуальних світів в реальному часі, здатну створювати повністю інтерактивні тривимірні простори. Користувач може переміщатися у віртуальному світі та впливати на нього за допомогою текстових запитів — причому протягом кількох хвилин, що в рази довше, ніж у випадку з Genie 2. Головне — модель запам'ятовує об'єкти та зміни у сцені, посилюючи таким чином правдоподібність симуляції. Нова версія нейромережі — поки що експериментальна технологія, доступна окремим тестувальникам. Однак Genie 3 вже дає непогане уявлення про те, як будуть розробляти ігри через 10–20 років, якщо не набагато раніше.
Що вміє Genie 3
Нейромережа Google належить до так званих світових моделей — ІІ-систем, які можуть використовувати розуміння світу для його симуляції. Genie 3 вміє передбачати, як різні дії повинні впливати на віртуальне середовище, і в реальному часі здійснює ці зміни.
На відміну від попередньої версії, нова Genie рендерить симуляцію вже в 720p, а не 360p; вікно взаємодії зі світом триває кілька хвилин, а не 10–20 секунд; а на команди модель реагує відразу ж — що ще нещодавно було неможливим.
Genie 3 може досить правдоподібно моделювати освітлення та відображення, а також інші фізичні властивості світу — на кшталт симуляції води. Вражає, що нейромережа здатна створювати цілі екосистеми з реалістичними тваринами та рослинами.
Причому одним реалізмом справа не обмежується: ІІ-модель також вміє генерувати мультяшні простори зі стилізованими неіснуючими створіннями — на кшталт ящірки з паперу або звіра, схожого на покемона.
Але головний прогрес Genie 3 полягає в тому, що нейромережа тепер має необхідну пам'ять, щоб запам'ятовувати зміни, які користувач вносить у симуляцію. Він може, наприклад, змінити погоду, додати нові об'єкти або персонажів, потім відвернутися, вийти зі сцени, а через деякий час повернутися — і всі його правки залишаться на місці. Звичайно, в системі починають накопичуватися помилки, однак, як вже згадувалося, стабільною вона залишається кілька хвилин — що є суттєвим покращенням.
Хотели бы вы поиграть в проект, где сюжет и мир создаются ИИ в реальном времени?
Поточні обмеження
Genie 3 вміє змінювати віртуальний світ за текстовими підказками. Скажімо, якщо написати команду «додати дерево», то модель відреагує на неї і внесе правку. Однак на нинішньому етапі сам ігровий персонаж, яким управляє користувач — так званий агент — може лише ходити, стрибати і виконувати базові дії. Від його імені посадити дерево не вийде. Подібні більш складні команди — на кшталт зміни погоди — відбуваються ніби «по чарівництву» за текстовою командою.
Дослідники Google також ламають голову над тим, як інтегрувати більше ніж одного агента у симуляцію. Моделювання взаємодій між кількома контрольованими персонажами поки що залишається надто складним завданням.
Ще Genie 3 на даний момент не може відтворювати реальні місця з максимальною точністю і стикається з труднощами в відображенні тексту.
Нарешті, творці Genie 3 продовжать активну роботу над стабільністю системи, щоб симуляції «жили» не кілька хвилин, а кілька годин. Хоча в цьому плані нова версія здійснила величезний стрибок у порівнянні з попередньою, саме тривалість вікна взаємодії з світом залишається ключовим обмеженням.
Це саме ті недоліки, про які заявляють самі інженери DeepMind. Якщо ж ви самі уважно розглянете демки, опубліковані Google, то зможете помітити і інші недоліки Genie 3. Наприклад, повністю статичні пальми під час симуляції урагану або не найякісніша рендеринг водних поверхонь у денних сценах. Також у демонстраціях — наприклад, з лижником — фізична поведінка снігу не завжди виглядає реалістично. До того ж майже в кожному ролику спостерігаються дрібні артефакти або несогласовані деталі в картинці. І, звичайно, не варто ігнорувати той факт, що Genie 3 поки що зовсім не вміє генерувати аудіо, а це негативно позначається на ефекті занурення.
Що все це означає для ігор майбутнього?
Насправді фокусуватися на недоліках Genie 3 в певній мірі безглуздо: через півроку–рік багато з них вже не будуть актуальні — настільки швидко розвиваються нейромережі. Пару років тому всі сміялися з згенерованого відео, в якому Вілл Сміт (Will Smith) їсть спагетті, а сьогодні багато людей у соціальних мережах приймають за справжній ролик про кенгуру, якого не пускають на борт пасажирського літака, створений за допомогою Veo 3.
Важливо те, що Genie 3 вже зараз дозволяє краще зрозуміти, які інструменти розробники ігор будуть використовувати в майбутньому для створення віртуальних пригод. Те, над чим працює Google, називають нейромережевими ігровими движками (neural game engines). Це — концепція ігрових движків нового типу, де багато функцій, такі як генерація рівнів, симуляція фізики, поведінки NPC або навіть графіки, будуть виконуватися ШІ, а не традиційним способом — за допомогою коду. Розробники зможуть, наприклад, анімувавати персонажів без необхідності займатися процесом вручну, а геймери отримають RPG з по-справжньому нелінійними наративами, в яких гра на льоту підлаштовується під дії гравця.
Правда, найімовірніше, що нейромережеві ігрові движки не повністю замінять традиційні, а скоріше інтегруються в них — стануть частиною платформ типу Unity або Unreal. По крайней мере, на початкових етапах, а з роками вони, можливо, розвинуться в повноцінні окремі інструменти.
Сьогодні технології типу Genie 3 не на тому рівні, щоб почати на їх основі робити ігри. Тим не менш, Джуліан Тогеліус (Julian Togelius), доцент кафедри комп'ютерних наук і інженерії Школи інженерії Тендон Нью-Йоркського університету, вважає, що навіть на поточному етапі Genie 3 може бути корисним для розробників. Він тестував модель і написав у своєму особистому блозі наступну думку:
Я думаю, вже зараз Genie 3 цілком можна використовувати для генерації ідей. Так, модель найкраще справляється з запитами, які знаходяться в межах її навчального розподілу (наприклад, «гонки на Ferrari по Грінвіч-Віллідж»), але саме такі результати виявляються найменш цікавими — це не ті проекти, в які хтось захотів би грати, якщо є можливість запустити хорошу гру.
Зате більш «вільні» запити, на кшталт «Tetris #reallife #photorealistic», давали дійсно захоплюючі та виразні результати — справжні інтерактивні галюцинації, в яких можна було покопатися і виявити несподівані можливості. У такому вигляді модель стає інструментом мислення, здатним допомогти як професійним, так і початківцям гейм-дизайнерам придумувати нові сценарії, механіки та ігрові активи, які потім можна відтворити в ігровому рушії.
У майбутньому яка-небудь наступна версія Genie цілком може стати інструментом для розробки прототипів. Дизайнери зможуть детально описувати свої задуми — і практично миттєво отримувати грубу, чорнову версію описаного ігрового сценарію в робочому вигляді.
***
Не виключено, що нейромережеві ігрові рушії — саме те, що потрібно, щоб вирішити поточну проблему розробки AAA-ігор. Створювати дорогі віртуальні пригоди стає все менш доцільно: бюджети роздуваються до сотень мільйонів доларів, а чекати великі ігри доводиться в середньому більше шести років. Далі буде гірше. Якщо нічого не зміниться, то умовну GTA 7 ми такими темпами побачимо в 2040-х. І ось якраз ІІ-моделі на кшталт Genie 3 у перспективі цілком могли б розвантажити авторів, зменшивши обсяг технічної роботи.
А що думаєте ви? Вражає розробка Google? Розкажіть у коментарях.
Как вы относитесь к идеи нейросетевых игровых движков?
-
AMD випустила нейромережу Amuse 3.0 для локальної генерації фото і відео на PC
-
NVIDIA вдосконалила DLSS: Технологія масштабування перейшла на нову нейромережу
-
Google намагається — і не може — навчити нейромережу створювати меми
-
Ілон Маск та xAI представили Grok 4 — «найрозумнішу нейромережу», за словами Маска
-
Нейросітка Adobe перетворить ваш бум на звук вибуху
-
ТОП-165: найкращі кооперативні ігри у 2025 році