Home Tehnoloģija Izstrādātāji ievērojami ietaupa ātrumu un ietaupa izmaksas ar jauno GPT-5.1 atjauninājumu

Izstrādātāji ievērojami ietaupa ātrumu un ietaupa izmaksas ar jauno GPT-5.1 atjauninājumu

29
0

Elyse Betters Picaro/ZDNET

Sekojiet ZDNET: Pievienojiet mūs kā vēlamo avotu Google tīklā.


ZDNET galvenās atziņas

  • GPT-5.1 paātrina kodēšanu, izmantojot adaptīvos un bezpamatošanas režīmus.
  • Jauna tūlītēja kešatmiņa samazina API izmaksas iegulto lietotņu izstrādātājiem.
  • Jauni rīki padara AI aģentus spējīgākus mūsdienu IDE ietvaros.

OpenAI ir atgriezies ar jaunu 5.1 atjauninājumu savam iepriekšējam GPT-5 lielās valodas modelim. GPT-5 tika ieviests augustā, kas ir pirms desmitiem gadu mūsu Visuma AI laika deformācijas ātruma versijā.

OpenAI, protams, izmanto AI, lai palīdzētu kodēt ātrāk. Galu galā tā ir sacīkste ar citiem lielajiem spēlētājiem, lai iegūtu tradžiljonu dolāru vērtību. Turklāt bez šaubām ir pierādīts, ka AI kodēšana profesionāla kodētāja rokās ir gandrīz maģisks spēka pavairotājs un projektu paātrinātājs.

(Informācijas atklāšana: Ziff Davis, ZDNET mātesuzņēmums, 2025. gada aprīlī iesniedza prasību pret OpenAI, apgalvojot, ka tas pārkāpis Ziff Davis autortiesības apmācībā un AI sistēmu darbībā.)

Tāpat: OpenAI GPT-5.1 padara ChatGPT “siltāku” un viedāku — kā tagad darbojas tā jauninātie režīmi

Lai iegūtu pārskatu par GPT-5.1 priekšrocībām patērētāju tērzēšanas robotu lietotājiem, izlasiet vecākās redaktores Sabrina Ortiz paskaidrojumu. Wager, ja jūs interesē AI izmantošana savā kodēšanā vai iegultā programmatūrā, turpiniet lasīt. Šim laidienam ir dažas taustāmas ātruma un izmaksu ietaupījuma priekšrocības.

Šajā rakstā mēs runājam par GPT-5.1 API. Citiem vārdiem sakot, mēs meklējam uzvedņu nosūtīšanu AI, izmantojot programmas funkcijas izsaukumu, un kā šī zvana atgriešanas vērtību iegūstam rezultātu.

Šī API virzītā AI funkcionalitāte darbojas izstrādātāju izstrādātajos programmatūras produktos, taču, tā kā paši izstrādātāja rīki izmanto API, lai sniegtu informāciju, tas palielina šo rīku lietderību. Tas dod labumu arī izstrādātājiem, kuri izmanto OpenAI Codex kodēšanas aģentu, jo Codex tagad ir pieejams 5.1 versijā.

Arī: labākie bezmaksas AI kursi un sertifikāti prasmju uzlabošanai 2025. gadā — un es tos visus esmu izmēģinājis

Piemēram, JetBrains ir izcilu izstrādes rīku ražotājs. Lai gan es pametu JetBrains platformu, jo VS Code tiek izmantots daudz plašāk (un man bieži par to jārunā), JetBrains produkti joprojām ir daži no maniem iecienītākajiem. Patiesībā, izmantojot VS kodu, es dažreiz palaižu garām dažas JetBrains funkcijas.

Tāpēc tas bija tik interesanti, kad Deniss Širjajevs, JetBrains AI DevTools ekosistēmas vadītājs, OpenAI emuāra ierakstā aprakstīja uzņēmuma pieredzi ar šo jauno GPT-5.1 laidienu. Viņš teica: “GPT 5.1 nav tikai vēl viens LLM — tas ir patiesi aģents, dabiski autonomākais modelis, ko jebkad esmu testējis.”

“Tas raksta tāpat kā jūs, kodus tāpat kā jūs, bez piepūles izpilda sarežģītas instrukcijas un lieliski iekļaujas priekšgala uzdevumos, labi iekļaujoties jūsu esošajā kodu bāzē,” viņš teica.

Apskatīsim dažus iemeslus, kāpēc GPT-5.1 saņem tik entuziasmu atsaucību.

Adaptīvā spriešana

Man šķita, ka kodēšana ar GPT-5 ir pārsteidzoši spēcīga, taču reizēm nogurdinoša. Neatkarīgi no tā, ko es jautāju AI, atbilde prasīja laiku. Pat uz visvienkāršāko jautājumu var paiet dažas minūtes, lai saņemtu atbildi. Tas ir tāpēc, ka visi vaicājumi nosūtīja pieprasījumu vienam un tam pašam modelim.

GPT-5.1 novērtē doto uzvedni un, pamatojoties uz to, vai jautājums būtībā ir viegls vai grūts, pielāgo, cik daudz kognitīvās pūles tas iegulda atbildē. Tas nozīmē, ka vienkāršiem jautājumiem vairs nebūs kavēšanās, kas bija tik nomākta, izmantojot vecāku kodēšanas modeli.

Šeit ir uzvedne, kuru es sniedzu GPT-5 tikai pirms dažām dienām: “Lūdzu, pārbaudiet manu darbu. Esmu pārdēvējis EDD_SL_Plugin_Updater, lai katram spraudnim, kas to izmanto, būtu unikāls nosaukums, lai izvairītos no konfliktiem. Es atjaunināju klases nosaukumu atjauninātāja failā, atjaunināju atjauninātāja faila nosaukumu un pēc tam atjaunināju spraudņa atsauces uz failu un spraudņa galveno failu, un vai spraudņa galvenais fails nav pieejams. Ja kaut ko atrodat un neveicat nekādas izmaiņas, ziņojiet man.

Tāpat: 10 ChatGPT uzvedņu triki, ko izmantoju — lai ātrāk iegūtu labākos rezultātus

Tas ir liels pieprasījums, kas liek AI skenēt apmēram 12 000 failu un sniegt man analīzi. Tam vajadzētu izmantot visu iespējamo domāšanas spēku.

Turpretim uzvedne, piemēram, “Kāda WP-CLI komanda parāda instalēto spraudņu sarakstu?” ir patiešām vienkāršs pieprasījums. Būtībā tā ir dokumentācijas meklēšana, kurai vispār nav vajadzīga reāla informācija. Tā ir tikai ātra laika taupīšanas uzvedne, tāpēc man nav jāpārslēdzas uz pārlūkprogrammu un jāveic Google meklēšana.

Atbildes uz ātro jautājumu ir ātrākas, un course of izmanto mazāk marķieru. Tokeni ir izmantotās apstrādes apjoma mērs. API zvani tiek iekasēti, pamatojoties uz marķieriem, kas nozīmē, ka vienkāršu ērtību jautājumu uzdošana maksās lētāk.

Tam ir vēl viens diezgan spēcīgs aspekts, ko OpenAI raksturo kā “noturīgāku dziļu argumentāciju”. Nekas nav tik nepatīkams kā ilgstoša saruna ar AI, un pēc tam tas zaudē izpratni par to, par ko jūs runājāt. Tagad OpenAI saka, ka AI var palikt uz pareizā ceļa ilgāk.

“Bez argumentācijas” režīms

Šis ir vēl viens no tiem gadījumiem, kad, manuprāt, OpenAI varētu gūt labumu no stabilas produktu pārvaldības, piešķirot produkta nosaukumu. Šis režīms neizslēdz konteksta izpratni, kvalitatīvu koda rakstīšanu vai instrukciju izpratni. Tas vienkārši izslēdz dziļu, domu ķēdes stila analīzi. Viņiem vajadzētu to nosaukt par režīmu “nepārdomājiet”.

Padomājiet par to šādā veidā. Mums visiem ir draugs, kurš pārdomā katru jautājumu vai darbību. Tas viņus nomāc, aizņem uz visiem laikiem, lai paveiktu vienkāršas lietas, un bieži noved pie analīzes paralīzes. Ir laiks lielai domāšanai, un ir laiks vienkārši izvēlēties papīru vai plastmasu un doties tālāk.

Tāpat: es apvienoju divus AI rīkus, lai atrisinātu lielu kļūdu, taču viņi to nevarēja izdarīt bez manis

Šis jaunais bezspriešanas režīms ļauj AI izvairīties no ierastās soli pa solim apspriedes un vienkārši pāriet uz atbildi. Tas ir ideāli piemērots vienkāršiem meklējumiem vai pamata uzdevumiem. Tas ievērojami samazina latentumu (reakcijas laiku). Tas arī rada atsaucīgāku, ātrāku un plūstošāku kodēšanas pieredzi.

Ja spriešanas režīms netiek apvienots ar adaptīvo spriešanu, mākslīgais intelekts var aizņemt laiku, lai atbildētu uz sarežģītiem jautājumiem, taču tas var ātri reaģēt uz vienkāršākiem jautājumiem.

Paplašināta tūlītēja kešatmiņa

Vēl viens ātruma palielinājums (ar papildu izmaksu samazināšanu) ir paplašināta tūlītēja kešatmiņa. Kad AI tiek dota uzvedne, tai vispirms ir jāizmanto dabiskās valodas apstrādes iespējas, lai parsētu šo uzvedni un noskaidrotu, kas tas ir, kas tam tiek prasīts.

Tas nav mazs varoņdarbs. AI pētniekiem ir pagājušas gadu desmitiem, lai panāktu, ka AI spēj saprast dabisko valodu, kā arī runātā kontekstu un smalkās nozīmes.

Tātad, kad tiek izdota uzvedne, mākslīgajam intelektam ir jāveic reāls darbs, lai to marķētu, lai izveidotu iekšējo attēlojumu, no kura veidot atbildi. Tas nav bez resursu izmantošanas izmaksām.

Arī: 10 ChatGPT Codex noslēpumi, kurus es uzzināju tikai pēc 60 stundu programmēšanas pārī ar to

Ja sesijas laikā jautājums tiek uzdots atkārtoti un tā pati vai līdzīga uzvedne ir jāinterpretē atkārtoti, šīs izmaksas tiek segtas vēlreiz. Ņemiet vērā, ka mēs nerunājam tikai par uzvednēm, ko programmētājs piešķir API, guess arī uzvednēm, kas darbojas lietojumprogrammā un kuras bieži var atkārtot lietojumprogrammas lietošanas laikā.

Ņemiet, piemēram, detalizētu uzvedni klientu atbalsta aģentam, kuram ir jāapstrādā viens un tas pats sākuma noteikumu kopums katrai mijiedarbībai ar klientu. Šīs uzvednes parsēšanai var būt nepieciešami tūkstošiem marķieru, un tā būtu jāveic tūkstošiem reižu dienā.

Saglabājot uzvedni kešatmiņā (un OpenAI tagad to dara 24 stundas), uzvedne tiek vienreiz kompilēta un pēc tam pieejama atkārtotai izmantošanai. Ātruma uzlabojumi un izmaksu ietaupījumi varētu būt ievērojami.

Labāks biznesa piemērs projektētājiem

Visi šie uzlabojumi nodrošina OpenAI labāku biznesa priekšstatu, ko piedāvāt klientiem projektēšanas vajadzībām. Design-in ir diezgan vecs mākslas termins, ko izmanto, lai aprakstītu, kad komponents ir paredzēts izstrādājumam.

Iespējams, visslavenākā (un visnozīmīgākā) projektēšana bija, kad IBM 1981. gadā izvēlējās Intel 8088 centrālo procesoru oriģinālajam IBM personālajam datoram. Šis viens lēmums iedarbināja visu x86 ekosistēmu un veicināja Intel panākumus procesoru jomā gadu desmitiem.

Mūsdienās Nvidia ir ieguvējs no milzīgiem dizaina lēmumiem no datu centru operatoru puses, kuri ir izsalkuši pēc lielākās AI apstrādes jaudas. Šis pieprasījums ir licis Nvidia kļūt par pasaulē vērtīgāko uzņēmumu tirgus apjoma ziņā kaut kur uz ziemeļiem no 5 triljoniem USD.

Tāpat: es 4 gadus izstrādāju produktu 4 dienās par 200 $, un es joprojām esmu apdullināts

OpenAI gūst labumu arī no dizaina iekārtām. CapCut ir video lietotne ar 361 miljons lejupielāžu 2025. gadā. Temu ir iepirkšanās lietotne ar 438 miljoniem lejupielāžu 2025. gadā. Ja, piemēram, kāds uzņēmums savā lietotnē iegultu AI un to darītu, izmantojot API izsaukumus no OpenAI, OpenAI varētu nopelnīt daudz naudas no kumulatīvā API zvanu apjoma un ar tiem saistītajiem norēķiniem.

Taču, tāpat kā ar fiziskiem komponentiem, pārdoto preču izmaksas vienmēr ir dizaina problēmas. Katra centa daļa COGS var palielināt kopējo gala cenu vai bīstami ietekmēt peļņas normas.

Tātad, ja OpenAI var ievērojami samazināt API zvanu izmaksas un joprojām nodrošināt AI vērtību, kā tas, šķiet, tika darīts ar GPT-5.1, pastāv daudz lielāka iespēja, ka tas var veicināt GPT-5.1 iekļaušanu izstrādātāju produktos.

Vairāk jaunu iespēju

GPT-5.1 laidiens ietver arī labāku kodēšanas veiktspēju. AI ir vadāmāks un piedāvājamāks, kas nozīmē, ka tas labāk ievēro norādījumus. Ja tikai mans kucēns varētu būt solītāks, mums nebūtu pastāvīgas sāpīgas raudas, kad tiek piegādāts pasts.

Kodējošais mākslīgais intelekts veic mazāk nevajadzīgas pārdomāšanas, ir sarunīgāks rīku izsaukšanas secību laikā un kopumā draudzīgāks secību mijiedarbības laikā. Ir arī jauns rīks apply_patch, kas palīdz veikt daudzpakāpju kodēšanas secības un aģentu darbības, kā arī jauns čaulas rīks, kas darbojas labāk, ja tiek lūgts ģenerēt komandrindas komandas un novērtēt un rīkoties, pamatojoties uz atbildēm.

Tāpat: OpenAI jums tagad ir jauns aģenta kodēšanas partneris: GPT-5-Codex

Esmu diezgan sajūsmā par šo jauno versiju. Tā kā es jau izmantoju GPT-5, būs patīkami redzēt, cik daudz reaģējošāka tas tagad ir ar GPT-5.1.

Kā ar tevi? Vai savā kodēšanas vai izstrādes darbplūsmā esat mēģinājis izmantot GPT-5 vai jaunos GPT-5.1 modeļus? Vai redzat, kādus ātruma vai izmaksu uzlabojumus OpenAI ir daudzsološs, vai arī joprojām vērtējat, vai šīs izmaiņas ir svarīgas jūsu projektiem? Cik svarīgas ir tādas funkcijas kā adaptīvā spriešana, bez spriešanas režīma vai ātra kešatmiņa, kad izlemjat, kuru AI modeli iestrādāt savos rīkos vai produktos? Paziņojiet mums tālāk sniegtajos komentāros.


Jūs varat sekot līdzi maniem ikdienas projektu atjauninājumiem sociālajos medijos. Noteikti abonējiet mans iknedēļas atjauninājumu biļetensun sekojiet man pakalpojumā Twitter/X plkst @DavidGewirtzFb plkst Facebook.com/DavidGewirtzInstagram plkst Instagram.com/DavidGewirtzvietnē Bluesky plkst @DavidGewirtz.comun vietnē YouTube plkst YouTube.com/DavidGewirtzTV.



avots