Sekojiet zdnet: Pievienojiet mūs kā vēlamo avotu Google.
ZDNET galvenie pārņemšana
- Openai reāllaika API tagad ir optimizēts un parasti pieejams.
- Jūs varat izmēģināt tā jaunāko runas-runas modeli GPT-RealTime.
- Jauninājumi uzlabo Openai balss piedāvājumu izstrādātājiem.
Šogad galvenā uzmanība ir pievērsta AI aģentiem, kas lietotāju vārdā var veikt uzdevumus, uzņēmumiem pastāvīgi izstrādājot piedāvājumus, kas samazina lietotāja darba slodzi. Lai padarītu šo mijiedarbību pēc iespējas nemanāmāku, daudzi uzņēmumi paļaujas uz multimodāliem AI aģentiem, un Openai šo produktu attīstību padara vēl vieglāku.
Arī: 3 gudri veidi, kā biznesa vadītāji var veidot veiksmīgas AI stratēģijas – pirms nav par vēlu
Pēc uzņēmuma teiktā, Openai ceturtdien atjaunināja savu reāllaika API, kas tagad ir parasti pieejams, ar jaunām funkcijām, kas ļauj izstrādātājiem un uzņēmumiem izveidot uzticamākus balss aģentus. Openai pirmo reizi uzsāka reāllaika API 2024. gada oktobrī publiskajā beta versijā. Turklāt uzņēmums izlaida savu vismodernāko runas-runas modeli, ko sauc par GPT-Realtime.
Izlaidumi:
Reāllaika API atjauninājumi
- Kas: Reāllaika API jauninājumi ietver atbalstu attālā modeļa konteksta protokola (MCP) serveriem, attēlu ievadiem un tālruņa izsaukšanai, izmantojot sesijas iniciācijas protokolu (SIP), saskaņā ar izlaidumu. Paziņojuma tiešraides laikā Openai pieminēja, ka MCP ir labi piemērots balss komandām, ļaujot lietotājiem nemanāmi veikt darbības no savienotām lietotnēm.
- Kāpēc tas ir svarīgi: Galu galā šīm paplašinātajām iespējām vajadzētu dot iespēju balss aģentiem piekļūt vairāk rīku un tiem būtu vairāk konteksta, lai palīdzētu lietotājiem. AI rīki ir tikai tikpat noderīgi kā viņu sniegtā informācija, tāpēc AI modeļu savienošanas procesa pilnveidošana ar datu avotiem ir liels ieguvums gan izstrādātājiem, gan lietotājiem. Vissvarīgākais ir tas, ka MCP atvērtais standarts nodrošina savienojumu izveidi, prioritizējot lietotāju datus un privātumu.
Jauns runas modelis runas modelī
- Kas: Openai atzina savu jauno GPT-REALTIME modeli kā uzņēmuma “vismodernākais, ražošanai gatavs balss modelis”. Jauninājumi ietver uzlabojumus intelektā, sarežģītās instrukcijas un funkciju izsaukšana. Tas var arī mainīt valodas teikuma vidū.
-
Modeļa demonstrācija parādīja, cik cilvēciski ir modelis, komplektā ar lēcieniem, kas atspoguļo plašu emociju klāstu. Modelis, šķiet, arī veiksmīgi ievēroja instrukcijas-Openai darbinieks imitēja jailbreak mēģinājumu, pretrunā ar sistēmas uzvedni, guess GPT-REALTIME mierīgi novirzījās un nepadevās mēģinājumiem. Tas arī analizēja fotoattēlu un tērzēja par to, ko tas redzēja.
-
Openai pievienoja arī divas jaunas balsis – Cedar un Marin, kas ir pieejamas tikai API.
-
Kāpēc tas ir svarīgi: Galvenais noderīgās balss palīdzību un mijiedarbības princips ir modeļi, kas izklausās dabiski un faktiski var palīdzēt ar uzdevumiem. Ja jaunais modelis darbojas kā apgalvots, tas lietotājiem nodrošinās labāku pieredzi.