Nauka & Technologia Wiadomości

2024-04-18 23:28:47+00:00

Sztuczna inteligencja osiąga nowy poziom realizmu dzięki VASA firmy Microsoft

Microsoft ogłosił uruchomienie nowej sieci neuronowej o nazwie VASA, która jest w stanie ożywiać zdjęcia i wirtualne postacie. Wykorzystując tylko jeden statyczny obraz i ścieżkę dźwiękową mowy, VASA tworzy filmy przedstawiające mówiące twarze, które ukazują szeroką gamę emocji, naturalnych ruchów głowy i mimiki. Dzięki szeroko zakrojonym eksperymentom i ocenie szeregu nowych wskaźników firma Microsoft próbowała przewyższyć poprzednie technologie generatywne.

VASA nie tylko zapewnia wysoką jakość wideo, ale także obsługuje generację online w rozdzielczości 512x512 do 40 kl./s przy niskim początkowym opóźnieniu. Może to utorować drogę do interakcji z wirtualnymi twarzami, które w przyszłości naśladują komunikację ludzką.

Realizm: model jest w stanie zsynchronizować ruchy warg z dźwiękiem i uchwycić szeroką gamę emocji, wyraziste niuanse twarzy i naturalne ruchy głowy.

Kontrolowane generowanie: Model dyfuzyjny jest w stanie uwzględnić takie parametry, jak kierunek spojrzenia, pozycja głowy i zmiany emocji.

Uogólnianie poza dystrybucją: metoda umożliwia przetwarzanie zdjęć i dźwięku wykraczających poza zbiór danych szkoleniowych, w tym rysunki i ilustracje. VASA może także wykorzystywać ścieżki dźwiękowe do śpiewania i mowę w języku innym niż angielski.

Generowanie w czasie rzeczywistym: metoda generuje klatki wideo w rozdzielczości 512 x 512 przy 45 klatkach na sekundę w trybie offline i może obsługiwać do 40 klatek na sekundę w trybie online przy opóźnieniu wynoszącym zaledwie 170 ms na komputerze PC z pojedynczą kartą graficzną NVIDIA RTX 4090.

Microsoft zdaje sobie sprawę z ryzyka i zauważa, że technologię należy wykorzystywać wyłącznie w dobrym celu. Istnieje jednak zagrożenie, że VASA może stać się niezastąpionym narzędziem w rękach oszustów. Dlatego w tej chwili Microsoft nie planuje udostępniania wersji demonstracyjnej, interfejsu API ani produktu online ani podawania dodatkowych szczegółów implementacji, dopóki nie uzyska całkowitej pewności, że sztuczna inteligencja będzie używana w sposób odpowiedzialny i zgodnie z jasnymi wytycznymi.

Biorąc pod uwagę potencjał tej technologii i możliwe zagrożenia związane z VASA, rozwój takiej sztucznej inteligencji w przyszłości będzie prawdopodobnie wolniejszy niż to możliwe.

Czy uważa Pan, że powinny obowiązywać rygorystyczne zasady korzystania z takich technologii?

bbabo.Net

Kijów potwierdził strzelaninę na granicy Naddniestrza: Kiszyniów jest gotowy na zbadanie sprawy
Ukraina (bbabo.net), - Ambasador Ukrainy w Mołdawii Marko Szewczenko potwierdził informację o incydencie zbrojnym
„Nie da się kupić domu samodzielnie” - w Abchazji przyjmuje się kodeks mieszkaniowy
Kaukaz (bbabo.net), - Parlament Abchazji przyjął w pierwszym czytaniu projekt Kodeksu mieszkaniowego Abchazji
„To będzie epicki wywiad”: Tucker Carlson rozmawiał z Władimirem Putinem przez 2 godziny
Ukraina (bbabo.net), - Wywiad Tuckera Carlsona z Władimirem Putinem trwa 2 godziny, ukaże się wkrótce i będzie „epicki”
Litwa odpowiedziała na oskarżenia o próbę ataku na Białoruś przy użyciu dronów
Białoruś (bbabo.net), - Atak dronów na Białoruś przez Litwę to „dezinformacja”. O tym oświadczył dzisiaj

Nauka & Technologia Wiadomości

Sztuczna inteligencja osiąga nowy poziom realizmu dzięki VASA firmy Microsoft

Kijów potwierdził strzelaninę na granicy Naddniestrza: Kiszyniów jest gotowy na zbadanie sprawy

„Nie da się kupić domu samodzielnie” - w Abchazji przyjmuje się kodeks mieszkaniowy

„To będzie epicki wywiad”: Tucker Carlson rozmawiał z Władimirem Putinem przez 2 godziny

Litwa odpowiedziała na oskarżenia o próbę ataku na Białoruś przy użyciu dronów