Meta objavila AI model za prevod govora na brojne jezike

Meta Platforms, Facebookova matična kuća, objavila je model umjetne inteligencije sposoban za prevode i transkripciju govora na više desetina jezika, što je potencijalni temelj za alate koji omogućavaju komunikaciju u stvarnom vremenu premošćujući jezičke podjele.

Takve podjele predstavljaju jaz među jezicima s obzirom na njihovu funkcionalnu održivost i zastupljenost na internetu.

Firma je u objavi na blogu objavila da njen model SeamlessM4T podržava prevode teksta i govora na gotovo stotinu jezika, kao i potpuni prevod govora u govor za 35 jezika, kombinirajući pritom tehnologiju koja je prije bila dostupna samo u zasebnim modelima.

Šef Mete Mark Zuckerberg je istakao da ima viziju alata koji olakšavaju interakcije među korisnicima iz cijelog svijeta u metaverzumu, a u objavi na blogu se navodi i to da Meta stavlja svoj model na raspolaganje javnosti za nekomercijalnu upotrebu.

Najveća firma za društvene medije je ove godine objavila mnoštvo uglavnom besplatnih AI modela.

Među njima je i veliki jezički model nazvan LLaMA (Large Language Model Meta AI), koji istraživačima umjetne inteligencije pomaže da unaprijede svoj rad na ovome polju.

Prema riječima Zuckerberga, otvoreni ekosistem umjetne inteligencije ide u korist Mete, s obzirom na to da kompanija dobija više učinkovitim crowd-sourcingom za stvaranje alata namijenjenih korisnicima za svoje društvene platforme, nego naplaćivanjem pristupa modelima.

Istovremeno, Meta se suočava sa sličnim pravnim pitanjima kao i ostatak industrije kada su posrijedi podaci o obuci koji su uneseni za izradu modela jer novi AI alati sve više olakšavaju kreiranje lažnih video, foto, audio sadržaja.

Kada je riječ o modelu SeamlessM4T, istraživači Mete u svome radu tvrde da su podatke o audio-obuci prikupili sa četiri miliona sati “sirovog zvuka koji dolazi iz javno dostupnog repozitorija indeksovanih internetskih podataka”, ali nisu naveli o kojem se repozitoriju radi.

U njihovom istraživačkom radu se navodi i da tekstualni podaci potiču iz skupova podataka koji su kreirani prošle godine, a sadržaje su izvukli sa Wikipedije i sličnih portala.

Izvor: RSE