Китайские гиганты технологий наращивают усилия в области видео-генерации более подробно ознакомимся с DynamiCrafter от Tencent.

Тенцент выпускает новую версию своей открытой видеоплатформы в понедельник, демонстрируя свое господство на китайском интернет-рынке с помощью игровой империи и приложения для обмена сообщениями WeChat.

Гонка Китая за созданием генеративных видео становится все более горячей с ENBLE.

В понедельник китайский интернет-гигант Tencent сделал фурор в мире технологий, представив на GitHub последнюю версию своей модели видеогенерации с открытым исходным кодом DynamiCrafter. Это объявление напоминает о том, что некоторые из крупнейших технологических компаний Китая тихо продвигаются в сфере преобразования текста и изображений в видео. Но что именно такое DynamiCrafter и в чем его отличие от конкурентов?

Сила Диффузии: Превращение подписей и изображений в живые видео

Подобно другим инструментам генерации видео на рынке, DynamiCrafter использует метод диффузии для преобразования подписей и статичных изображений в увлекательные видео. Вдохновленная явлением диффузии в физике, техника диффузии в машинном обучении позволяет простым данным превратиться в более сложные и реалистичные данные. Это похоже на то, как частицы перемещаются из областей с высокой концентрацией в области с низкой концентрацией.

В случае DynamiCrafter второе поколение этого инструмента способно создавать видео с разрешением 640×1024 пикселей, что значительно лучше, чем его первая версия, вышедшая в октябре и поддерживавшая только видео с разрешением 320×512 пикселей. Команда DynamiCrafter объясняет в научной статье, что их технология отличается от конкурентов тем, что расширяет применение техник анимации изображений в “более общем визуальном контенте”. В то время как традиционные техники фокусируются на анимации естественных сцен или движений, DynamiCrafter включает изображение в процесс генерации, используя предварительное движение моделей диффузии текста в видео.

DynamiCrafter в действии: Взгляд в мир анимации

Чтобы понять, как DynamiCrafter сравнивается с другими моделями диффузии видео, была проведена демонстрация, сопоставляющая DynamiCrafter с моделью стабильной диффузии видео (запущенной в ноябре) и недавно популярной Pika Labs. Важно отметить, что выбранные образцы в демонстрации могут провоцировать в пользу DynamiCrafter, но модель Tencent, по-видимому, производит немного более “живые” результаты по сравнению со своими конкурентами. Однако, даже после нескольких попыток, ни одна из моделей не создает впечатление, что ИИ скоро сможет производить полноценные фильмы.

Возрождение генеративных видео в гонке ИИ

Генеративные видео вызывают значительное внимание как следующий этап в гонке ИИ, заимствуя успехи генерации текста и изображений. Как стартапы, так и крупные технологические гиганты инвестируют значительные ресурсы в эту область, и Китай не является исключением. Помимо Tencent, другие крупные игроки, такие как ByteDance (компания-мать TikTok), Baidu и Alibaba, также выпустили собственные модели диффузии видео.

Как MagicVideo ByteDance и UniVG Baidu уже представили демонстрации на GitHub, хотя они еще не доступны общественности. Alibaba также выбрал путь открытого исходного кода, сделав свою модель генерации видео, VGen, доступной глобальному сообществу разработчиков. Ясно, что эти усилия отражают растущий интерес и потенциал генеративных видео.

Q&A: Обращение к дополнительным вопросам и опасениям

Q: Можно ли использовать DynamiCrafter для профессионального видеопроизводства?

A: Хотя DynamiCrafter показывает потенциал в создании анимационных видео из текста и изображений, в настоящее время он не соответствует созданию содержимого, подходящего для полноценного профессионального видеопроизводства. Однако, по мере развития технологии ИИ, можно ожидать значительных прогрессов в этой области.

Q: Существуют ли какие-либо этические проблемы, связанные с технологией генеративного видео?

A: Технология генеративного видео вызывает этические вопросы относительно потенциального злоупотребления созданным ИИ-контентом. По мере усовершенствования этих инструментов необходимо предпринимать меры для обеспечения подлинности и предотвращения распространения вводящей в заблуждение или поддельной информации.

Q: Как генеративные видео повлияют на индустрию развлечений?

A: Хотя генеративные видео имеют потенциал усилить творчество и упростить процесс видеопроизводства, они маловероятно заменят необходимость в человеческом творчестве и экспертизе в индустрии развлечений. Вместо этого эти инструменты могут служить мощными помощниками для создателей контента, позволяя им более эффективно воплощать свои идеи.

Будущее генерации видео и искусственного интеллекта

Выход DynamiCrafter и других моделей видео диффузии крупными китайскими технологическими компаниями подчеркивает растущую значимость генеративных видео в ландшафте ИИ. По мере продолжения исследований и разработок в этой области, мы можем ожидать дальнейших прогрессов в технологии, расширяющих границы того, что ИИ может достичь в генерации творческого контента.

Чтобы быть в курсе последних новостей и событий в области генерации видео и ИИ, вот несколько полезных ссылок:

Мы бы хотели услышать ваши мысли о будущем генеративных видео и его потенциальном влиянии. Поделитесь своими мнениями и присоединяйтесь к обсуждению в социальных сетях!