Мицрософт је најавио лансирање нове неуронске мреже под називом ВАСА, која је способна да оживи фотографије и виртуелне ликове. Користећи само једну статичну слику и аудио запис говора, ВАСА прави видео снимке лица која говоре која приказују широк спектар емоција, природних покрета главе и израза лица. Кроз опсежно експериментисање и евалуацију бројних нових метрика, Мицрософт је покушао да надмаши претходне генеративне технологије.
ВАСА не само да пружа видео високог квалитета, већ подржава и онлајн генерисање у резолуцији 512к512 до 40 фпс са малим почетним кашњењем. Ово би могло отворити пут за интеракције са виртуелним лицима која опонашају људску комуникацију у будућности.
Реализам: Модел је способан да синхронизује покрете усана са звуком и ухвати широк спектар емоција, изражајних нијанси лица и природних покрета главе.
Генерисање које се може контролисати: Модел дифузије је у стању да узме у обзир параметре као што су правац погледа, положај главе и промене у емоцијама.
Генерализација ван дистрибуције: Метод је способан за обраду фотографија и звука који се протежу изван скупа података за обуку, укључујући цртеже и илустрације. ВАСА такође може да користи аудио записе за певање и неенглески говор.
Генерисање у реалном времену: Метод генерише 512к512 видео оквира при 45 кадрова у секунди ван мреже и може да подржи до 40 кадрова у секунди на мрежи са кашњењем од чак 170 мс на рачунару са једном НВИДИА РТКС 4090 графичком картицом.
Мицрософт препознаје ризике и напомиње да се технологија треба користити само за добро. Међутим, постоји претња да би ВАСА могла постати незаменљив алат у рукама преваранта. Стога, у овом тренутку, Мицрософт не планира да објави онлајн демо, АПИ или производ, нити да пружи додатне детаље о имплементацији, све док дефинитивно не буде уверен да ће АИ бити коришћена одговорно и у складу са јасним смерницама.
С обзиром на потенцијал технологије и могуће опасности повезане са ВАСА-ом, развој такве вештачке интелигенције у будућности ће вероватно бити спорији него што је могуће.
Да ли мислите да треба да постоје строга правила за коришћење таквих технологија?
bbabo.Net