Програмите за създаването на 3D графика с помощта на невронни мрежи достигнаха до такова качество, че фалшивото видео вече много трудно може да бъде различено от истинското. Съвсем скоро изобщо няма да бъдем уверени, че човекът, гледащ ни от екрана на телевизора е истинският политик, а не компютърна симулация.

През месец декември 2015 година учените от Вашингтонския университет представиха технологията на цифровите двойници: създаване на „живи“ 3D модели от голям брой фотографии на истинския персонаж. По-известните хора, както и политиците е събран огромен архив с най-различни фотографии. Новата програма създава модел, който подобно на кукла на конци, може да бъде изцяло управляван: да прави всякакви мимики и гримаси, както и да произнася със собствения си глас всякакви думи.

А сега, малко преди началото на събитието SIGGRAPH 2017 същата група специалисти публикува нова научна работа по същата тема – създаване на цифрови двойници.

Новите алгоритми вече могат да се учат не само от фотографии, но и от видеоклипове, като по този начин обучението на невронната мрежа става значително по-бързо. За да демонстрират новата си технология учените избраха известен практически на всички персонаж – бившият президент на САЩ Барак Обама. Това е добър избор, понеже в Мрежата има огромен брой HD видеоматериали с него и за обучението на невронната мрежа са налични милиони кадри видео.

Невронната мрежа изучи до най-малките детайли особеностите на мимиките на Обама: движението на устните при всеки звук, появата на бръчици около очите, промените на веждите и наклона на главата. Мимиката бе удачно свързана със звуците, произнасяни от 3D модела и е очевидно, че невронната мрежа обработва не само кадрите, но и звуците с тях.

По този начин, слабият ИИ се научи да синхронизира мимиката на лицето и движението на устните, спрямо произволна реч, подадена от на входа на невронната мрежа.

В тийзъра към научната работа се сравняват различните реални видеозаписи на Обама със синтезираното от невронната мрежа видео.

Синтезираният резултат се различава от оригинала, но изглежда много реалистично и е очевидно, че тази технология може да бъде усъвършенствана.

Новата технология може да се използва за повишаване качеството на видеоконференциите чрез синтезиране на изгубените в потока информация видеокадри. Естествено, технологията може да е особено полезна във компютърните игри и виртуалната реалност. Геймърите могат да се обръщат към към някой истински човек или към историческа личност.

Недостатък на тази технология е, че не може да моделира емоции. Изражението на лицето е винаги неутрално и почти еднакво.


Коментирайте статията в нашите Форуми. За да научите първи най-важното, харесайте страницата ни във Facebook, и ни последвайте в Google Новини, TikTok, Telegram и Viber или изтеглете приложението на Kaldata.com за Android, iOS и Huawei!

4 Коментара
стари
нови оценка
Отзиви
Всички коментари