OpenAI випускає Sora 2: відео та аудіо на базі штучного інтелекту з'являться в соціальному додатку.

  • OpenAI представляє Sora 2 із синхронізованою генерацією відео та аудіо, а також значними покращеннями фізики.
  • Соціальний додаток для iOS постачається з перевіреними камео, налаштовуваною стрічкою та покращеною модерацією.
  • Заходи безпеки: водяні знаки, контроль ідентифікації, обмеження для підлітків та обмеження контенту.
  • Початкова доступність за запрошенням у США та Канаді, безкоштовне користування з обмеженнями та розширений доступ для передплатників Pro.

Відеогенератор Sora 2 від OpenAI

Створення кліпів із майже професійним оздобленням стає доступним кожному: презентація OpenAI Сора 2, його нову відеомодель з інтегрованим аудіо, а також додаток для iPhone, який забезпечує більш пряме та соціальне використання. Пропозиція зосереджена на доступності та візуальна та звукова узгодженість, з результатами, які, згідно з демонстраціями, здаються набагато правдоподібнішими.

Запуск поєднує технічні досягнення з рівнем продукту, розробленим для творців та широкої публіки. Sora 2 обіцяє краща фізична точність, безперервність між кадрами та контроль стилю, а також інструмент редагування, який дозволяє вставляти власну людину у згенеровані сцени. Розгортання починається з запрошення в США та Канаду, безкоштовно з місцями та опціями вищої якості для передплатників ChatGPT.

Що таке Sora 2 і що вона насправді пропонує?

Сора 2
Пов'язана стаття:
Sora 2: OpenAI прагне створити відео на базі штучного інтелекту та соціальний додаток

Нова версія робить значний крок вперед порівняно з першою Sora: тепер система підтримує збереження об'єкта та стану на кількох площинах він ланцюгово з'єднує дії, не порушуючи безперервності, та краще підкоряється законам фізики. OpenAI ілюструє це невдалим баскетбольним кидком, який цього разу... природно підстрибує замість того, щоб «телепортуватися» до обруча, що було поширеною помилкою в попередніх моделях.

Sora 2 від OpenAI, соціальний додаток та генератор відео

Ця більш правдоподібна поведінка підтримується масштабним навчанням з відеоданими та точнішими методами керування наративом. Модель розуміє складні сигнали, поважає просторову та часову безперервність і пропонує стилі, починаючи від фільм до анімації, з більш послідовним налаштуванням тривалості та зміною сцени.

Інтегрований звук, стилі та творчий контроль

Ще однією новинкою є генерація рідного звукуSora 2 створює звукові пейзажі, ефекти та навіть діалоги, синхронізовані із зображенням, за допомогою простої команди. Така інтеграція забезпечує занурення та зменшує залежність від постпродакшну, що досі пропонували лише деякі альтернативи на ринку.

Система дозволяє модуляцію тону, кадрування та візуальну обробку, а також дозволяє створювати короткі послідовності – зазвичай до 10 секунд— розроблено для мобільного споживання. Хоча прогрес очевидний, OpenAI визнає, що модель все ще допускає помилки та що повна узгодженість не гарантується у всіх контекстах.

Соціальний додаток: камео, стрічка, що налаштовується, та модерація

Разом із моделлю, OpenAI випускає додаток для iOS під назвою Sora з відеотрансляцією та функціями. реміксКористувач може з'являтися як камео в сценах, що створюються після короткої перевірки обличчя та голосу, що дозволяє вставляти його зображення з явними дозволами. За задумом, створення відбувається всередині програми, і за винятком цього процесу перевірки, не підтримує завантаження файлів з фотоплівки на цьому етапі.

Компанія стверджує, що алгоритм подачі керується інструкції природною мовою і надає пріоритет контенту від людей, з якими взаємодіє користувач, уникаючи оптимізації часу використання. Для посилення безпеки Sora встановлює обмеження за замовчуванням на Підлітки, інтегрує батьківський контроль від ChatGPT та обмежує використання конфіденційних даних: обличчя публічних осіб без їхньої згоди, а також контент для дорослих чи екстремістський контент не допускаються.

Щодо походження та прав, усі відео містять водяні знаки та цифрові облікові дані щоб визначити його походження. OpenAI стверджує, що має внутрішні інструменти виявлення та навіть обмежує кількість знімків екрана. На рівні інтелектуальної власності компанія підтримує систему запит на виключення для правовласників, рішення, яке відродило дискусію щодо навчання з матеріалами, доступними в Інтернеті.

Доступ, ціна та дорожня карта

Доступ починається за запрошенням у Сполучених Штатах та Канаді, з початковим використанням безкоштовні та щедрі квоти залежно від обчислювальної потужності. Абоненти ChatGPT Pro мають варіант вищої якості, Sora 2 Pro, і компанія планує відкрити API пізніше. Попередня модель, Sora 1 Turbo, також залишається, і планується версія для Android, дата виходу якої поки що не підтверджена.

OpenAI планує дозволити платежам генерувати більше відео, якщо попит перевищує ресурси. У Європі розширення залежатиме від регуляторні міркування, тому публічного календаря наразі немає.

Вплив на творців та конкуренцію на ринку

Для невеликих студій, агентств та сольних творців Sora 2 знижує бар'єри, дозволяючи високоякісний матеріал з меншими витратами та часом. Водночас це створює тиск на такі сектори, як стокове відео або певні робочі процеси анімації та візуальних ефектів, яким доведеться співіснувати зі штучним інтелектом, здатним відтворювати завдання за лічені секунди.

Цей рух узгоджується з процвітаючою екосистемою: Google просуває Veo 3, Meta досліджує соціальні формати за допомогою штучного інтелекту, а такі платформи, як Runway та Pika, досягають прогресу в аудіовізуальній генерації. Відданість OpenAI об'єднанню модель та соціальна мережа прагне виділитися завдяки інтегрованому досвіду, який поєднує творення, участь та контроль ідентичності.

Сора вказує на чіткий напрямок: більше достовірних відео, синхронізований звук та соціальний рівень, призначений для створення та обміну з меншими труднощами. Проєкт передбачає посилений контроль та відкриті суперечки щодо прав та навчання, але також обіцяє зробити передове аудіовізуальне виробництво доступним для більшої кількості людей, враховуючи його глобальне розгортання.


Слідкуйте за нами в Новинах Google