Elevenlabs pagājušajā nedēļā paziņoja par sava jaunākā mākslīgā intelekta (AI) teksta-runas (TTS) modeļa valodas paplašināšanu. Izmantojot šo paplašināšanos, AI modelis tagad atbalsta 41 jaunu valodu, kopējo skaitu ņemot vērā 70 atbalstītās valodas. Ņujorkas pilsētā bāzētais AI startup sacīja, ka, izmantojot šo paplašināšanos, modelis tagad ir pieejams 90 procentiem pasaules iedzīvotāju. Proti, uzņēmums 8. jūnijā izlaida vienpadsmit V3 (Alfa) modeli un izveidoja to kā “visizteiktāko TTS modeli”.
Vienpadsmit v3 tagad atbalsta 70 valodas
A postenis X (agrāk pazīstams kā Twitter) oficiālais Elevenlabs rokturis paziņoja, ka viņu jaunākais AI modelis Eleven V3 tagad atbalsta papildu 41 valodu. Izmantojot šo atjauninājumu, modelis var dabiski ģenerēt audio no teksta skriptiem kopumā 70 valodās. Dažas no nesen pievienotajām valodām ir arābu, asamiešu, bengāļu, bulgāru, katalāņu, gudžaratu, latviešu, malajiešu, malajalu, marathi, Nepālijas, svahili, tamilu un telugu.
Uzņēmums ieteica, ka tiem, kas vēlas ģenerēt tekstu jebkurā no jaunajām valodām, vajadzētu ierakstīt tūlītēju balss klonu (IVC), izvēloties valodu. Turklāt Elevenlabs nākamajās nedēļās pievieno arī balss bibliotēkas balsis jaunajām valodām.
Vienpadsmit V3 ir daudzvalodu V2 un V2.5 TTS modeļu pēctecis. Jaunākais AI modelis atbalsts Iekšējās audio tagi, piemēram, čuksti, satraukti, nopūta un daudz kas cits. Audio tagu pievienošana ļauj modelim pievienot izteiksmīgas emocionālas nianses, neverbālās norādes un dramatisku piegādi audio paaudzei.
Tas atbalsta arī daudzspēku intakcijas ar pārtraukumiem, dabisku ritmu un pārklājošiem dialogiem. Turklāt uzņēmums saka, ka modelis labāk apstrādā tādus elementus kā stress, kadence un kontekstuālā izpratne. Vienpadsmit V3 ir pieejams, izmantojot uzņēmuma vietni un mobilās lietotnes. Pašlaik tas nav pieejams kā lietojumprogrammu interfeiss (API).
Aprīlī Elevenlabs iepazīstināja ar jaunu uz uzņēmumu orientētu aģentu funkciju, kas nodēvēta par aģenta transfēru. Daļa no uzņēmuma sarunvalodas AI ļauj diviem AI aģentiem sazināties un dalīties sarunās. Funkcija izveido sistēmu, kurā viens AI aģents kopā ar sarunu datiem var nodot sarunu citam, specializētākam aģentam.