Google Genie 3: модель світу, яка дає життя проекту Genie

  • Genie 3 — це модель світу Google DeepMind, яка є основою Project Genie, прототипу для створення інтерактивних середовищ за допомогою штучного інтелекту.
  • Project Genie генерує навігаційні світи в режимі реального часу з тексту та зображень, без необхідності знати, як програмувати чи проектувати.
  • Сеанси обмежені 60 секундами, а сценарії не є повністю фотореалістичними, принаймні на цьому експериментальному етапі.
  • Наразі він доступний лише для передплатників Google AI Ultra у США, з планами розширення на інші території в майбутньому.

Google Genie 3

Google почав практично демонструвати можливості свого нового покоління світові моделі з Genie 3Через Project Genie компанія дозволяє обраним користувачам створювати та досліджувати інтерактивні середовища, згенеровані штучним інтелектом, на основі описів природною мовою та деяких довідкових зображень.

Цей крок є частиною зобов'язання Google DeepMind щодо систем, здатних моделювати складну динаміку реального світуОкрім класичних агентів, які домінують у закритих іграх, таких як шахи чи Го, проєкт прагне майбутнього, де розробка віртуальних світів може бути такою ж простою, як запис того, що у вас на думці. Хоча доступ наразі обмежений платними передплатниками у Сполучених Штатах, проєкт передбачає майбутнє, де розробка віртуальних світів може бути такою ж простою, як запис своїх ідей.

Джин 3: Модель світу, що стоїть за експериментом

В основі проекту «Джин» лежить Genie 3, модель загального призначення Розроблено Google DeepMind. На відміну від інших статичних систем, його функція полягає не лише в малюванні красивих пейзажів, а й у прогнозуванні того, як змінюється середовище, коли користувач рухається, взаємодіє або змінює елементи в ньому.

Цей тип архітектури відомий як світова модельGenie 3 — це система штучного інтелекту, здатна передбачати розвиток сценарію та вплив дій у цьому середовищі. Вона генерує шлях, яким ви рухаєтесь, у режимі реального часу, кадр за кадром, зберігаючи просторову та візуальну узгодженість, яка виходить за рамки простої анімації чи прогулянки застиглою 3D-сценою.

Для досягнення цього модель використовує авторегресивна генераціяЦей метод дозволяє штучному інтелекту крок за кроком створювати світ, пам'ятаючи те, що він уже створив. Якщо персонаж обертається або повертається назад, штучний інтелект «пам'ятає», що було раніше, і послідовно реконструює це — ключовий елемент для моделювання великих, правдоподібних просторів, будь то міське середовище, історичний ландшафт чи повністю вигаданий світ.

Як працює Project Genie: від тексту до ігрового світу

Проект Genie представлений як додаток, доступний з браузераПодібно до інших сервісів Google на основі штучного інтелекту, немає потреби встановлювати щось або мати передові технічні знання: взаємодія по суті зводиться до опису того, чого ви хочете досягти, і дозволяння системі зробити все інше.

Процес починається з фази, яку Google називає «Малювання світів»Користувач відповідає на прості запитання на кшталт «Який у вас світ?» та надає детальну інформацію про середовище (ландшафт, погоду, стиль графіки, атмосферу) та про те, як він воліє його досліджувати: ходьба, політ, керування автомобілем, верхова їзда чи інші види транспорту. Він також вказує бажану перспективу – від першої чи третьої особи.

Google Genie 3

Далі потрібно визначити персонажа: Це може бути людина, тварина, предмет або інша сутність. більш абстрактно. З цією інформацією в гру вступає Nano Banana Pro, ще одна модель Google, яка генерує статичне зображення попереднього перегляду. Такий початковий знімок служить для перевірки, чи відповідає світ тому, що має на увазі користувач, перш ніж розпочати інтерактивне дослідження.

Якщо результат не переконливий, можливо налаштувати підказку, змінити елементи сцениКористувачі можуть змінювати зовнішній вигляд аватара або налаштовувати візуальний стиль. Вони можуть завантажувати власні зображення, використовувати матеріали, згенеровані іншими штучними інтелектами, або починати зі справжніх фотографій, а система поєднує всі ці дані для вдосконалення середовища, яке потім стає зручним для навігації.

Дослідження в реальному часі: світи, що реагують на ваші рухи

Після того, як світ визначено, а попередній перегляд прийнято, Project Genie перемикається в інтерактивний режим. Саме тут Genie 3 розкриває свої можливості моделюванняКоли гравець рухається сценою, модель у режимі реального часу генерує те, що знаходиться перед ним, враховуючи те, що вже створено, та приблизні фізичні правила середовища.

Користувач пересувається за допомогою стандартних елементів керування для ПК, таких як клавіші W, A, S та D для руху, і може налаштувати камеру щоб змінити кут огляду. Ігровий процес працює з роздільною здатністю до 720p та швидкістю взаємодії близько 20-24 кадрів на секунду, чого достатньо для забезпечення прийнятного відчуття плавності на цьому експериментальному етапі.

Приклади, запропоновані Google, включають, наприклад, океан гігантських хвиль, що видно з кінчика дошки для серфінгуАбо високогірний ландшафт з деформованим снігом, де гравець втілює альпініста з всенаправленим рухом. В обох випадках інтерес полягає не лише в початковому ландшафті, а й у тому, як оточення реагує на дії персонажа, зміни напрямку чи стрибки.

Створюйте ремікси, діліться та експериментуйте з іншими світами

Project Genie не щоразу починається з нуля. Однією з його найвражаючих особливостей є його здатність «реміксування існуючих світів»Користувачі можуть досліджувати раніше створені сценарії, самостійно, іншими або вибрані з кураторської галереї, та використовувати їх як основу для створення нових версій.

Цей варіант реміксу дозволяє застосовувати нові інструкції до вже згенерованого світуЦього можна досягти, змінюючи стиль, додаючи елементи, змінюючи спосіб дослідження гри або повністю модифікуючи тип персонажа. Крім того, існує режим випадкової генерації, який називається «рандомайзер», який пропонує середовища з непередбачуваними характеристиками для тих, хто шукає натхнення або просто хоче експериментувати.

В кінці сеансу система пропонує можливість Завантажте відео з туру, простий спосіб ділитися творіннями в соціальних мережах, на відеоплатформах або в професійних контекстах, таких як анімаційні студії, дизайн рівнів або дослідницькі лабораторії, які хочуть документувати свої тести.

Технічні обмеження та поточний стан проекту

Незважаючи на весь свій потенціал, Google наполягає, що Project Genie поки що... прототип дослідження на ранній стадіїЦе видно з кількох обмежень, які сама лабораторія детально описує у своєму блозі та повідомленнях про використання.

Найчіткіший з них – це обмеження часу сеансівКожен світ можна досліджувати максимум 60 секунд, що є лімітом візуальної пам'яті, який Genie 3 наразі може стабільно обробляти. Це обмежує тривалість вражень, які поки що більше нагадують мікропригоди або короткі сцени, ніж повноцінні відеоігри.

Крім того, Google попереджає, що Сцени не повністю фотореалістичні Вони також не завжди дотримуються інструкцій користувача досконально. Фізика також може бути приблизною: певна поведінка, зіткнення чи рухи можуть не завжди відповідати законам реального світу, що цілком очікувано в системі, яка все ще перебуває на стадії розробки.

Ще один момент, який варто виділити, — це керування персонажами, яке Вони можуть демонструвати певну затримку або брак точності у реакції на команди користувача. Хоча частота кадрів прийнятна, невеликі затримки в управлінні помітні, особливо для тих, хто звик до високоякісних комерційних відеоігор.

Нарешті, деякі розширені можливості Genie 3 Функції, анонсовані в попередніх демоверсіях, ще не представлені в цій версії. Серед них – події, що змінюють світ під час його дослідження, функція, яка може призвести до набагато багатшого ігрового процесу, але поки що залишається на стадії розробки.

Плани обмеженого доступу та географічного розширення

На цьому першому етапі доступ до проекту Genie Обмежено користувачами віком від 18 років, які підписані на Google AI Ultra у Сполучених Штатах. Ця підписка з високою щомісячною платою чітко показує, що експеримент спочатку спрямований на невелику аудиторію з досить професійним або дуже захопленим профілем.

Google заявив про свій намір розширити доступність на інші території Щойно система стане надійнішою та збере достатньо даних про її реальне використання, очікується, що за умови розвитку прототипу, він зрештою пошириться на інші ключові ринки, включаючи Європейський Союз та, в його рамках, Іспанію. Хоча конкретні дати чи країни не оголошені, очікується, що за умови розвитку прототипу він зрештою досягне інших ключових ринків, включаючи Європейський Союз та, в його рамках, Іспанію.

Це розширення, у будь-якому разі, залежатиме не лише від технічних питань, а й від нормативні вимоги та вимоги щодо захисту даних які особливо суворі в Європі. Сама компанія Google наполягає на тому, що діятиме крок за кроком і без вагань закриватиме проекти, які не відповідають її цілям, що вже спостерігалося з іншими сервісами компанії.

Лабораторія для ЗШІ та цифрової творчості

Окрім безпосереднього впливу на відеоігри чи розваги, Genie 3 та Project Genie вписуються у стратегію Google DeepMind, спрямовану на... більш загальні системи штучного інтелектуСвітові моделі особливо цінні для навчання агентів, яким потрібно розуміти складні контексти, передбачати наслідки та діяти послідовно в умовах змін у середовищі.

Потенційні застосування варіюються від робототехніка та моделювання фізичних сценаріїв Це включає все: від моделювання анімації та відтворення історичних місць до дослідження вигаданих світів у кіно, телебаченні та інтерактивному контенті. Можливість швидкого виконання ітерацій у середовищах, створених штучним інтелектом, скорочує час і витрати, що може бути цікавим як для невеликих студій, так і для великих європейських продюсерських компаній.

Водночас, відкриття такого прототипу для зовнішніх користувачів функціонує як великомасштабний випробувальний стендВзаємодія, помилки та ідеї, запропоновані учасниками, допоможуть скоригувати модель, визначити варіанти використання, які, можливо, раніше не розглядалися, та оцінити ризики, як технічні, так і етичні, пов'язані з цими дедалі реалістичнішими симуляціями.

З Genie 3 та Project Genie, Google досліджує територію, де створення віртуальних світів стає набагато доступнішим, хоча все ще з чіткими обмеженнями щодо візуальної якості, контролю та тривалості вражень; якщо експеримент дозріє та подолає фазу обмеженого доступу, він може стати актуальним інструментом також для користувачів та компаній в Іспанії та решті Європи, зацікавлених у нових формах інтерактивного дизайну та симуляції штучного інтелекту.

Google Genie 3
Пов'язана стаття:
Google Genie 3: Штучний інтелект від DeepMind, який створює інтерактивні віртуальні світи

Слідкуйте за нами в Новинах Google