Meta objavila AI model za prevod govora na brojne jezike

Najveća kompanija društvenih mreža ove je godine objavila mnoštvo uglavnom besplatnih AI modela

Meta objavila AI model za prevod govora na brojne jezike

Meta Platforms, Facebookova matična kuća, objavila je model umjetne inteligencije sposoban za prevode i transkripciju govora na više desetina jezika, što je potencijalni temelj za alate koji omogućavaju komunikaciju u stvarnom vremenu premošćujući jezičke podjele.

Takve podjele predstavljaju jaz među jezicima s obzirom na njihovu funkcionalnu održivost i zastupljenost na internetu.

Firma je u objavi na blogu objavila da njen model SeamlessM4T podržava prevode teksta i govora na gotovo stotinu jezika, kao i potpuni prevod govora u govor za 35 jezika, kombinirajući pritom tehnologiju koja je prije bila dostupna samo u zasebnim modelima.

Šef Mete Mark Zuckerberg je istakao da ima viziju alata koji olakšavaju interakcije među korisnicima iz cijelog svijeta u metaverzumu, a u objavi na blogu se navodi i to da Meta stavlja svoj model na raspolaganje javnosti za nekomercijalnu upotrebu.

Najveća firma za društvene medije je ove godine objavila mnoštvo uglavnom besplatnih AI modela.

Među njima je i veliki jezički model nazvan LLaMA (Large Language Model Meta AI), koji istraživačima umjetne inteligencije pomaže da unaprijede svoj rad na ovome polju.

Prema riječima Zuckerberga, otvoreni ekosistem umjetne inteligencije ide u korist Mete, s obzirom na to da kompanija dobija više učinkovitim crowd-sourcingom za stvaranje alata namijenjenih korisnicima za svoje društvene platforme, nego naplaćivanjem pristupa modelima.

Istovremeno, Meta se suočava sa sličnim pravnim pitanjima kao i ostatak industrije kada su posrijedi podaci o obuci koji su uneseni za izradu modela jer novi AI alati sve više olakšavaju kreiranje lažnih video, foto, audio sadržaja.

Kada je riječ o modelu SeamlessM4T, istraživači Mete u svome radu tvrde da su podatke o audio-obuci prikupili sa četiri miliona sati “sirovog zvuka koji dolazi iz javno dostupnog repozitorija indeksovanih internetskih podataka”, ali nisu naveli o kojem se repozitoriju radi.

U njihovom istraživačkom radu se navodi i da tekstualni podaci potiču iz skupova podataka koji su kreirani prošle godine, a sadržaje su izvukli sa Wikipedije i sličnih portala.

Izvor: RSE

About The Author