Компания ByteDance представила систему искусственного интеллекта, которая способна превратить любую фотографию в убедительное видеопредставление, наполненное тонкими выражениями и эмоциональной глубиной, которые могут соперничать с реальными кадрами.
Китайский технологический гигант, известный по TikTok, разработал свою систему «X-Portrait 2», чтобы неподвижные изображения отражали сцены из известных фильмов — с результатами настолько реалистичными, что стирают грань между подлинным и искусственным контентом.
Демонстрации системы демонстрируют неподвижные фотографии, исполняющие культовые сцены из таких фильмов, как «Сияние», «Без лица» и «Ограды», улавливая каждое тонкое выражение из оригинальных выступлений. Теперь одна фотография может отображать страх, ярость или радость с той же убедительной детализацией, что и обученный актер, сохраняя при этом личность и характеристики исходного человека.Этот прорыв наступает в решающий момент. Поскольку общество борется с цифровой дезинформацией и последствиями президентских выборов в США, способность X-Portrait 2 создавать неотличимые от реальности видео из любой фотографии вызывает серьезные опасения. Предыдущие инструменты анимации ИИ давали явно искусственные результаты с механическими движениями. Но новая система ByteDance улавливает естественный поток лицевых мышц, тонкие движения глаз и сложные выражения, которые делают человеческие лица уникально выразительными.
ByteDance достигла этого реализма с помощью инновационного подхода. Вместо отслеживания определенных точек на лице — стандартного метода, используемого большинством программ для анимации — система наблюдает и учится на полных движениях лица. Там, где старые системы создавали выражения, соединяя точки, X-Portrait 2 улавливает плавное движение всего лица, даже во время быстрой речи или при просмотре с разных углов.База данных TikTok с миллиардом пользователей: секрет прорыва ByteDance в области ИИ
Преимущество ByteDance проистекает из его уникального положения владельца TikTok, который ежедневно обрабатывает более миллиарда видеороликов, созданных пользователями. Эта огромная коллекция выражений лица, движений и эмоций предоставляет данные для обучения в масштабе, недоступном большинству компаний, занимающихся ИИ. В то время как конкуренты полагаются на ограниченные наборы данных или синтетические данные, ByteDance может настраивать свои модели ИИ, используя реальные выражения, снятые на разных лицах, в разных условиях освещения и под разными углами камеры.
Выпуск X-Portrait 2 совпадает с расширением исследований ИИ ByteDance за пределы Китая. Компания создает новые исследовательские центры в Европе с потенциальными филиалами в Швейцарии, Великобритании и Франции. Планируемый центр ИИ стоимостью 2,13 млрд долларов в Малайзии и сотрудничество с Университетом Цинхуа предполагают стратегию по созданию экспертных знаний в области ИИ на нескольких континентах.
Этот глобальный исследовательский рывок происходит в критический момент. Пока ByteDance сталкивается с регулирующими проверками на западных рынках, включая недавний приказ Канады прекратить работу TikTok и продолжающиеся дебаты в США об ограничениях, компания продолжает развивать свои технические возможности.
Следующая революция Голливуда: как ИИ может заменить захват движения стоимостью в миллионы долларов
Последствия для индустрии анимации выходят за рамки технических достижений. Крупные студии в настоящее время тратят миллионы на оборудование для захвата движения и нанимают сотни аниматоров для создания реалистичных выражений лица. X-Portrait 2 предлагает будущее, в котором один фотограф и эталонное видео могут заменить большую часть этой инфраструктуры.
Этот сдвиг происходит на фоне растущих дебатов о контенте, созданном ИИ, и цифровых правах. В то время как конкуренты поспешили опубликовать свой код, ByteDance сохранила реализацию X-Portrait 2 в тайне — решение, которое отражает растущую осведомленность о том, как инструменты ИИ могут быть использованы не по назначению для создания несанкционированных представлений или вводящего в заблуждение контента.
Сосредоточение внимания ByteDance на движении и выражении человека отличает ее от других компаний, занимающихся ИИ. В то время как такие компании, как OpenAI и Anthropic, концентрируются на обработке языка, ByteDance опирается на свою основную силу: понимание того, как люди двигаются и выражают себя на камеру. Эта специализация напрямую вытекает из многолетнего анализа танцевальных тенденций и выражений лица TikTok.
Этот акцент на человеческом движении может оказаться более значимым, чем предполагает текущий анализ рынка. Поскольку работа и общение все больше перемещаются в виртуальные пространства, технология, которая точно улавливает и передает человеческие эмоции, становится решающей. Достижения ByteDance позволяют ей влиять на то, как люди будут взаимодействовать в цифровой среде, от деловых встреч до развлечений.
0 комментариев