Відкрийте телефон, запишіть кілька секунд і з'явіться в сцені, яка ще мить тому була неможливою: саме такий досвід пропонується. Сора 2, One штучний інтелект, який переосмислює короткі відеоДодаток просить вас зробити короткий знімок обличчя та голосу, а потім «розміщує» вас у кліпі, який зберігає безперервність середовища без розпаду всього, поєднуючи кадри з відчуттям контролю, яке досі було важко побачити.
Щоб зрозуміти контекст, варто згадати нещодавній шлях генеративного штучного інтелекту: від появи ChatGPT У 2022 році його було представлено для моделей зображень, а в 2024 році — для першої Sora. Ця версія вже натякала на сталість об'єктів та певну візуальну узгодженість; тепер, з Sora 2, OpenAI конкурує з такими альтернативами, як Runway Gen-4, на ринку, що швидко розвивається.
Що змінюється з Sora 2
OpenAI описує Sora 2 як стрибок, подібний до того, що був GPT‑3.5 у тексті: більша фізична точність, менше «телепортації» та більша стабільність між площинами, подібно до інструментів автоматичного кадрування, таких як Adobe Auto ReframeЯкщо м'яч не влучає в кошик, правдоподібно підстрибує на приладовій панелі замість того, щоб зникати, і система точніше виконує складні підказки.
Окрім відео, модель генерує голоси, ефекти та звукові пейзажі синхронізовано, що відкриває шлях до більш повних фрагментів без зовнішнього редагування. Загальна узгодженість покращується, хоча OpenAI визнає, що недоліки все ще єУ вимогливих сценах все ще з'являються дивні рухи або повороти, які видають штучний інтелект.
Додаток, створений для створення, а не лише для перегляду
Разом із моделлю постачається додаток із вертикальною стрічкою, що нагадує TikTok. Vibes, відеострічка від Meta, але з однією ключовою відмінністю: Усі кліпи генеруються за допомогою штучного інтелектуПоточне обмеження становить 10 секунд, і наразі ви не можете завантажувати файли зі своєї фотоплівки; ідея полягає в тому, щоб створювати відео в самому додатку та ремікс контент інших людей.
Система дозволяє "камео" після перевірки вашого обличчя та голосу. Коли хтось використовує ваше зображення, ви отримуєте сповіщення навіть якщо відео ще знаходиться в чернетці, і ви можете керувати дозволами, щоб скасувати це використання пізніше. Цей досвід орієнтований на спільне створення та пропозиції налаштовувані рекомендації за допомогою природної мови, надаючи пріоритет контактам над вірусним контентом за замовчуванням.
Благополуччя, контроль ідентифікації та безпека
OpenAI запевняє, що не прагне «нескінченного прокручування» та що додаток надає пріоритети створити перед вживаннямДля підлітків застосовуються базові обмеження щодо кількості поколінь та додаткові обмеження щодо камео. батьківський контроль керованим з ChatGPT; турбота про вплив коротких відео на дітей мотивує частину цих заходів.
Компанія поєднує перевірку особи, знаки походження та людську модерацію для боротьби з видаванням себе за іншу особу, домаганнями та зловмисним використанням. Це також працює на інструмент оцінки віку перенаправити неповнолітніх на більш обмежений досвід, хоча конкретні деталі для Sora 2 ще не були повністю оприлюднені.
Наявність, ціна та доступ
Розгортання розпочинається на iOS та за запрошеннями у Сполучених Штатах і Канаді, з планами розширення на інші регіони пізніше. Широкий доступ до Європи, включаючи Іспанія, не має дати. На даний момент сервіс починається безкоштовно з обмеженнями використання пов'язаний з обчислювальною потужністю.
Передплатники на ChatGPT Pro матиме Sora 2 Pro з вищою якістю та переважним доступом, а OpenAI планує активувати модель через API для інтеграції зі сторонніми розробниками та веб-використання; ініціативи щодо створення відео за допомогою штучного інтелекту передбачити, як ці API можуть вписатися в зовнішні робочі процеси.
Що воно робить добре, а що не робить
У поширених прикладах можна побачити помітний прогрес: гімнастичні комплекси, перевороти та сцени дії з покращеною жорсткістю, вагою та безперервністю. В анімації або покадрова анімація, дефекти краще маскуються, але в реалістичних ситуаціях все одно з'являються «дивні» жести або неприродні траєкторії.
Найяскравіший випадок – гра на пляжі: м'яч жорстко обертається А його відскоки на піску здаються м'якими, як асфальт. Тим не менш, загальне враження таке, що глюки «підходять» персонажу та сцені, а не є алгоритмічною помилкою, що є кроком вперед у порівнянні з першою Сорою.
Конкуренти та правова база
Крок OpenAI збігається з наступом Meta та Google: Meta AI запускає Vibes, відеострічку на основі штучного інтелекту, а YouTube інтегрує їхню модель. Veo 3TikTok, зі свого боку, посилює правила, щоб запобігти оманливий контент створені штучним інтелектом на теми, що становлять суспільний інтерес.
Захист авторських прав у Sora 2 є суворим та іноді вони блокують запити покоління. OpenAI стикається зі значними судовими процесами, такими як позов від Нью-Йорк Таймс— які визначають темпи розгортання та вимагають чітких ознак походження та контролю прав на створений контент.
Використання та наслідки в промисловості
Завдяки нативному відео та аудіо, а також простому соціальному інтерфейсу, Sora 2 знижує бар'єри для входу. творці, агентства та невеликі студії, які тепер можуть створювати прототипи або виготовляти короткі деталі з меншими ресурсами завдяки таким інструментам, як Vimeo СтворитиЦе також викликає питання щодо таких секторів, як відеостокове відео або певні Робочі процеси візуальні ефекти, на які може тиснути швидкість і вартість генеративного штучного інтелекту.
Серед його можливостей — персоналізовані сцени за допомогою камео, спільний ремікс і кліпи, готові до поширення в мережах, завжди з урахуванням поточних обмежень фізичної когерентності в довгих або дуже складних сценах.
Між технічними досягненнями, соціальним дизайном та пакетом гарантій, Sora 2 вказує на новий етап для відео на базі штучного інтелекту: більше контролю з боку користувачів, більше відстеження та спочатку обмежений доступ. Залишається побачити, чи витримає ця пропозиція конкуренцію з існуючими конкурентами. нормативні вимоги, але планку реалізму та повсякденного використання явно підняли.