Bbabo NET

Vetenskap & Teknik Nyheter

Yandex lanserade flerstämmig voice-over för YouTube-videor

Yandex-teamet tillkännagav lanseringen av en mycket bekväm funktion för Yandex Browser-användare - möjligheten att titta på videor med flerstämmiga röster.

Webbläsaren använde ursprungligen två syntetiserade röster för att översätta tal: en manlig och en kvinna. Nu har användare tillgång till en polyfonisk översättning av videon - det finns tolv röster, sex manliga och sex kvinnor. Som utvecklarna noterar, tack vare förbättrade algoritmer, har det blivit mycket lättare att uppfatta videor med ett stort antal talande deltagare.

"Webbläsaren" "distribuerar" röster till olika högtalare och "kommer ihåg" dem med hjälp av Yandex neurala nätverksteknologier. Först översätter ett neuralt nätverk tal till text, återställer interpunktion och bestämmer meningsgränser. Sedan analyserar ett annat neuralt nätverk röstens spektrogram och noterar de fragment som talas av olika personer. Så det blir tydligt vem av talarna som sa vad.

Kom ihåg att för ett år sedan, i september 2021, lanserade Yandex-teamet för massanvändning möjligheten att titta på engelskspråkiga videor på många populära plattformar, inklusive YouTube och Vimeo, med automatiskt ryskspråkigt röstskådespeleri.

Yandex lanserade flerstämmig voice-over för YouTube-videor