Openai palaists a Jauna AI modeļu ģimene Šorīt tas ievērojami uzlabo kodēšanas spējas, samazinot izmaksas, tieši reaģējot uz pieaugošo konkurenci uzņēmuma AI tirgū.
Sanfrancisko bāzētais AI uzņēmums ieviesa trīs modeļus-GPT-4.1, GPT-4.1 Mini un GPT-4.1 Nano-visi Pieejams nekavējoties caur tās API. Jaunais sastāvs labāk darbojas programmatūras inženierijas uzdevumos, precīzāk seko norādījumiem un var apstrādāt līdz vienam miljonam konteksta žetonu, kas ir līdzvērtīgi aptuveni 750 000 vārdu.
“GPT-4.1 piedāvā izcilu sniegumu par zemākām izmaksām,” pirmdienas paziņojuma laikā sacīja Openai galvenais produktu vadītājs Kevins Veils. “Šie modeļi ir labāki nekā GPT-4O gandrīz katrā dimensijā.”
Varbūt visnozīmīgākais uzņēmuma klientiem ir cenu noteikšana: GPT-4.1 maksās par 26% mazāk nekā tā priekšgājējs, savukārt vieglā nano versija kļūst par Openai vispieejamāko piedāvājumu tikai par 12 centiem par miljonu žetonu.
Kā GPT-4.1 uzlabojumi mērķa uzņēmuma izstrādātāju lielākie sāpju punkti
Kendinārā intervijā ar VentureBeat, Michelle Pokrass, pēc apmācības pētījumu vadība Openai, uzsvēra, ka praktiskās biznesa lietojumprogrammas vadīja attīstības procesu.
“GPT-4.1 tika apmācīts ar vienu mērķi: tā ir noderīga izstrādātājiem,” Pokrass stāstīja VentureBeat. “Mēs esam secinājuši, ka GPT-4.1 ir daudz labāks, lai ievērotu instrukcijas, kuras uzņēmumi izmanto praksē, kas daudz atvieglo lietojumprogrammu izvietošanu.”
Šī uzmanība uz reālās pasaules lietderību atspoguļojas etalona rezultātos. Uz Swe-bench verificētskas mēra programmatūras inženierijas iespējas, GPT-4.1 ieguva 54,6%-ievērojams 21,4 procentu punktu uzlabojums salīdzinājumā ar GPT-4O.
Uzņēmumiem, kas izstrādā AI aģentus, kuri patstāvīgi darbojas sarežģītos uzdevumos, sekojošo mācību uzlabojumi ir īpaši vērtīgi. Scale MultiChallenge etalonā GPT-4.1 ieguva 38,3%, pārspējot GPT-4O par 10,5 procentpunktiem.
Kāpēc Openai trīspakāpju modeļa stratēģija izaicina konkurentus, piemēram, Google un Antropic
Trīs atšķirīgu modeļu ieviešana dažādos cenu punktos attiecas uz dažādo AI tirgu. GPT-4.1 pamatiniciatīva ir paredzēta sarežģītām uzņēmuma lietojumprogrammām, savukārt mini un nano versijas attiecas uz lietošanas gadījumiem, kur ātrums un izmaksu efektivitāte ir prioritātes.
“Ne visiem uzdevumiem ir vajadzīgas visvairāk inteliģences vai augstākās iespējas,” Pokrass stāstīja VentureBeat. “Nano būs darba zirga modelis lietošanas gadījumiem, piemēram, automātiskai pabeigšanai, klasifikācijai, datu ieguvei vai jebko citu, kur galvenā problēma ir ātrums.”
Vienlaicīgi Openai paziņoja par plāniem nolietot GPT-4.5 priekšskatījums – Tās lielākais un dārgākais modelis, kas izlaists tikai pirms diviem mēnešiem – no tā API līdz 14. jūlijam. Uzņēmums pozicionēja GPT-4.1 kā rentablāku nomaiņu, kas nodrošina “uzlabotu vai līdzīgu veiktspēju daudzās galvenajās iespējām par daudz zemākām izmaksām un latentumu”.
Šis solis ļauj Openai atgūt skaitļošanas resursus, vienlaikus nodrošinot izstrādātājiem efektīvāku alternatīvu tā dārgākajam piedāvājumam, kura cena bija USD 75 par miljonu ievades žetonu un 150 USD par miljonu izvades marķieru.
Reālās pasaules rezultāti: kā Thomson Reuters, Carlyle un Windsurf izmanto GPT-4.1
Vairāki uzņēmuma klienti, kuri pārbaudīja modeļus pirms palaišanas, ziņoja par būtiskiem uzlabojumiem viņu īpašajos jomās.
Thomson Reuters, izmantojot GPT-4.1, ar savu likumīgo AI asistentu Cocounsel, redzēja uzlabojumu par 17% vairāku dokumentu pārskata precizitātē. Šis uzlabojums ir īpaši vērtīgs sarežģītām juridiskām darbplūsmām, kurās iesaistīti ilgstoši dokumenti ar niansētām attiecībām starp klauzulām.
Finanšu firma Karaļa ziņoja par 50% labāku sniegumu, iegūstot granulus finanšu datus no blīviem dokumentiem-kritiska spēja investīciju analīzei un lēmumu pieņemšanai.
Varun Mohan, kodēšanas rīku nodrošinātāja izpilddirektors Vindsērfs (Bijušais kodeiums) paziņojuma laikā kopīgoja detalizētu veiktspējas rādītāju.
“Mēs noskaidrojām, ka GPT-4.1 samazina to reižu skaitu, kas tam ir jālasa nevajadzīgi faili par 40%, salīdzinot ar citiem vadošajiem modeļiem, kā arī maina nevajadzīgus failus par 70% mazāk,” sacīja Mohans. “Modelis ir arī pārsteidzoši mazāk skaļš… GPT-4.1 ir par 50% mazāks nekā citi vadošie modeļi.”
Konteksts miljonos taktu: ko uzņēmumi var darīt ar 8x vairāk apstrādes jaudu
Visiem trim modeļiem ir viena miljona žetonu konteksta logs-astoņas reizes lielāks nekā GPT-4O 128 000 žetonu ierobežojums. Šī paplašinātā ietilpība ļauj modeļiem vienlaikus apstrādāt vairākus garus dokumentus vai veselas kodu bāzes.
Demonstrācijā Openai parādīja GPT-4.1, analizējot 450 000-token NASA servera žurnāla failu no 1995. gada, identificējot anomālu ierakstu, kas slēpjas dziļi datos. Šī spēja ir īpaši vērtīga uzdevumiem, kas saistīti ar lielām datu kopām, piemēram, kodu krātuvēm vai korporatīvo dokumentu kolekcijām.
Tomēr Openai atzīst veiktspējas degradāciju ar ārkārtīgi lielām izejvielām. Uz tā iekšējo Openai-MRCR pārbaudeprecizitāte samazinājās no aptuveni 84% ar 8000 žetonu līdz 50% ar vienu miljonu žetonu.
Kā mainās uzņēmuma AI ainava, kad Google, Antropic un Openai sacenšas par izstrādātājiem
Izlaidums notiek, jo sacensības uzņēmuma AI telpā sakarst. Google nesen uzsāka Dvīņi 2.5 Pro ar salīdzināmu viena miljona kniedes konteksta logu, savukārt antropic Claude 3.7 sonets ir ieguvis vilci ar uzņēmumiem, kas meklē Openai piedāvājuma alternatīvas.
Arī ķīniešu AI Startup DeepSeek nesen modernizēja savus modeļus, izdarot papildu spiedienu uz Openai, lai saglabātu savu vadības stāvokli.
“Ir bijis ļoti forši redzēt, kā uzlabojumi ilgstošā kontekstā ir kļuvuši par labāku veiktspēju īpašās vertikālēs, piemēram, juridiskajā analīzē un finanšu datu iegūšanai,” sacīja Pokrass. “Mēs esam uzskatījuši, ka ir svarīgi pārbaudīt mūsu modeļus ārpus akadēmiskajiem etaloniem un pārliecināties, ka tie labi darbojas ar uzņēmumiem un izstrādātājiem.”
Atbrīvojot šos modeļus īpaši caur tā API Tā vietā, lai ChatGpt, Openai norāda uz savu apņemšanos attīstītājiem un uzņēmuma klientiem. Uzņēmums plāno pakāpeniski iekļaut GPT-4.1 funkcijas laika gaitā, taču galvenā uzmanība tiek pievērsta spēcīgu rīku nodrošināšanai uzņēmumiem, kas veido specializētas lietojumprogrammas.
Lai veicinātu turpmākus pētījumus ilgstoša konteksta apstrādē, Openai izdod divas vērtēšanas datu kopas: Openai-Mrcr Lai pārbaudītu vairāku apaļu kodēšanas spējas un Grafiks Lai novērtētu sarežģītu argumentāciju garos dokumentos.
Uzņēmuma lēmumu pieņēmējiem, GPT-4.1 ģimene piedāvā praktiskāku, rentablāku pieeju AI ieviešanai. Tā kā organizācijas turpina integrēt AI savās darbībās, šie uzlabojumi uzticamībā, specifiskumā un efektivitātē varētu paātrināt adopciju visās nozarēs, kuras joprojām sver ieviešanas izmaksas pret iespējamiem ieguvumiem.
Kaut arī konkurenti pakaļdzīšanās lielākiem, dārgākiem modeļiem, Openai stratēģiskais pagrieziens ar GPT-4.1 liecina, ka AI nākotne var nebūt pie lielākajiem modeļiem, guess gan visefektīvākajiem. Patiesais izrāviens, iespējams, nav etalonos, guess gan uzņēmuma līmeņa AI piesaistīšanā vairāk uzņēmumu nekā jebkad agrāk.
avots