Digital

16.02.2024 14:37:25
Digital

Новая нейросеть от OpenAI Sora превратит изображения и текст в видео

Нейросеть преобразует текстовые задания в видеоролики. На форуме разработчиков OpenAI уже начались разговоры о риске потери работы моушен-дизайнеров

OpenAI представила нейросеть Sora для преобразования текста в видео. С еепомощью можно генерировать ролики длительностью до минуты, сообщается насайте компании.

ИИ-модель способна создавать сложные сцены с несколькими персонажами иточной детализацией, сохраняя при этом визуальное качество и следованиеподсказкам пользователя, говорится в описании Sora. Также нейросеть умеетгенерировать видео на основе статичного изображения, добавляя недостающиекадры.

В одной из ветокфорума разработчиков OpenAI сегодня началось обсуждениевозможностей Sora. Один из пользователей, представившийся как моушен-дизайнер,американской анимационной студии Laika, выразил опасение, что Sora может лишитьработы «огромное количество людей, работающих в кино и анимации».

«Как профессиональный аниматор, я поражен возможностями, которыедемонстрирует Sora. Я заинтригован и одновременно напуган. Долгое времяаниматоры покадровой анимации боялись, что на нашу работу придут CG-аниматоры.Вместо этого теперь кажется, что ИИ придет за их работой, а потом и займетместа всех моушен-дизайнеров. Я заинтересован в том, чтобы поделиться своимуникальным взглядом на OpenAI, насколько это возможно. Я также хочупредупредить OpenAI, что у Sora действительно есть потенциал, который можетлишить работы огромное количество людей, работающих в кино и анимации», —говорится в комментарии.

Пока Sora находится на этапе тестирования. Доступ к ней открыт ограниченномуколичеству пользователей: дизайнерам, художникам, кинорежиссерам — дляполучения обратной связи и доработки ИИ. 

Создатели технологии также предупредили, что у нейросети все еще есть слабыестороны, среди которых — отсутствие причинно-следственных связей. Например, водном из сгенерированных роликов женщина задувает свечи на торте, но они непотухают.

Сгенерированные Sora ролики

Промт: камера направлена прямо на красочные здания в Бурано, Италия.Очаровательный далматинец смотрит в окно здания на первом этаже. Множестволюдей прогуливаются пешком или на велосипеде по улицам канала передзданиями.

Промт: стильная женщина идет по улице Токио, наполненной теплым светящимсянеоном. Она носит черную кожаную куртку, длинное красное платье и черныесапоги, а также черную сумочку. 

Промт: исторические кадры Калифорнии во времена золотой лихорадки.

Разработчики OpenAI создают классификатор обнаружения, с помощью которогоможно определить, когда видео сгенерировано Sora. В том числе планируетсяиспользовать метаданные C2PA для определения происхождения ролика. 

Ранее на этой неделе OpenAIобъявилао тестировании функции ChatGPT — возможности запоминать информацию овзаимодействии с пользователем с прошлого момента использования. До этого в ИИиспользовалась контекстная память, которая сохранялась только на протяженииодного разговора. 

Автор: Pupkin

Источник: ria novosti