Категории: Новости

Модель преобразования текста в видео OpenAI Sora впечатляет X, но все же имеет недостатки

Компания OpenAI, занимающаяся искусственным интеллектом, представила в четверг свою первую модель преобразования текста в видео, получившую бурный прием, хотя фирма признает, что этой модели еще есть над чем работать.

15 февраля OpenAI представила новую генеративную модель искусственного интеллекта, получившую название Sora, которая, как говорят, позволяет создавать подробные видеоролики из простых текстовых подсказок, продолжать существующие видеоролики и даже генерировать сцены на основе неподвижного изображения.

https://twitter.com/gdb/status/1758193811489243408?ref_src=twsrc%5Etfw

Фирма, занимающаяся искусственным интеллектом, написала, что Sora была основана на прошлых исследованиях моделей GPT и DALL-E3, что, по утверждению фирмы, делает модель лучше в более «достоверном» представлении пользовательских данных.

OpenAI признала, что у Соры все еще есть несколько недостатков, и ей сложно точно смоделировать физику сложной сцены, а именно, запутывая природу причины и следствия.

«Например, человек может откусить кусочек печенья, но после этого на печенье может не остаться следа от укуса».

По словам представителей компании, новый инструмент также может сбивать с толку «пространственные детали» заданной подсказки, путая левое и правое или не следуя точным описаниям направлений.

Сора может случайно создать физически неправдоподобное движение. Источник: ОпенАИ

OpenAI заявила, что новая генеративная модель на данный момент доступна только «красным командам» (на техническом языке исследователей кибербезопасности) для оценки «критических областей на предмет вреда или рисков», а также избранным дизайнерам, художникам и кинематографистам для сбора отзывов о том, какпродвигать модель.

В декабре 2023 года отчет Стэнфордского университета показал, что инструменты создания изображений на базе искусственного интеллекта с использованием базы данных искусственного интеллекта LAION обучались на тысячах изображений незаконных материалов о жестоком обращении с детьми, что вызывает серьезные этические и юридические проблемы в области преобразования текста в текст. модели изображений или видео.

Пользователи X потеряли дар речи

На X распространяются десятки демонстрационных видео, демонстрирующих примеры Соры в действии, а Сора сейчас находится в тренде на X с более чем 173 000 постов.

Стремясь продемонстрировать, на что способна новая генеративная модель, генеральный директор OpenAI Сэм Альтман открыл себя для запросов на генерацию видео от пользователей X, при этом руководитель ИИ поделился в общей сложности семью видеороликами, созданными Sora, начиная отутка на драконе обратно к золотистым ретриверам, записывающим подкаст на вершине горы.

https://twitter.com/DrJimFan/status/1758210245799920123?ref_src=twsrc%5Etfw

По мнению Фана, Sora — это не столько инструмент для создания видео, сколько «физический движок, управляемый данными», поскольку модель искусственного интеллекта не просто генерирует абстрактное видео, но также детерминированно создает физику объектов в самой сцене.

Victoria Lyapota

Автор, являюсь внимательным наблюдателем тенденций и новых идей в области криптовалют и блокчейн технологий. Слежу за последними новостями и развитиями в этой области и готов анализировать и интерпретировать их для читателей. Стремлюсь быть в курсе всех новых идей и инноваций в криптоиндустрии, чтобы статьи были всегда актуальными и полезными. Моя цель - предоставить читателям полную и достоверную информацию о последних тенденциях и развитиях в криптоиндустрии. Считаю, что быть внимательным к тенденциям и новым идеям - важный аспект моей работы как автора, поскольку позволяет мне предоставлять читателям самую свежую и актуальную информацию в этой быстро развивающейся области.

Недавние статьи

XRP ниже 1 доллара? Ничего не происходит, утверждает аналитик-миллионер

XRP Ripple торговался ниже уровня в 1 доллар в течение почти трех лет, на что…

3 часа ago

Tether чеканит дополнительные 3 миллиарда долларов США в стейблкоинах

Эмитент стейблкоинов Tether 23 ноября выпустил дополнительные токены USDt (USDT) на сумму 3 миллиарда долларов…

4 часа ago

Бычьи признаки для Cardano: эксперт прогнозирует целевую цену в $6 по мере роста покупательского давления

Cardano (ADA), в настоящее время занимающая девятое место по величине криптовалюты, стала одной из лучших…

6 часов ago

Резервный банк Индии расширяет платформу трансграничных платежей

Резервный банк Индии (RBI) стремится расширить свою платформу трансграничных платежей, которая позволит осуществлять мгновенные расчеты,…

7 часов ago

Соотношение покупок/продаж биткоин-тейкеров на основных биржах резко возрастает — кто покупает?

Цена Биткоина несколько остыла, изо всех сил пытаясь достичь столь желанной отметки в 100 000…

12 часов ago

NFT рекордный еженедельный объем продаж в размере 158 миллионов долларов США, во главе с Ethereum и Bitcoin

Невзаимозаменяемые токены (NFT) сохранили относительно высокий еженедельный объем продаж, несмотря на небольшое снижение по сравнению…

14 часов ago