Openai augusta palaišana No tā GPT-5 lielās valodas modeļa bija nedaudz katastrofa. Livertream laikā bija glitches, modelim ģenerējot diagrammas ar acīmredzami neprecīziem skaitļiem. Reddit AMA ar Openai darbiniekiem lietotāji sūdzējās, ka jaunais modelis nav draudzīgs, un aicināja uzņēmumu atjaunot iepriekšējo versiju. Galvenokārt kritiķi satvēra, ka GPT-5 atpalika no stratosfēras cerībām, kuras Openai gadiem ilgi ir sulas. Apsolīts kā spēles mainītājs, GPT-5, iespējams, patiešām ir spēlējis labāk. Wager tā joprojām bija tā pati spēle.
Skeptiķi par brīdi sagrāba, lai pasludinātu AI uzplaukuma beigas. Daži pat paredzēja citas AI ziemas sākumu. “GPT-5 bija visu laiku augstākā AI sistēma,” pilna laika burbuļu kopējais Gerijs Markuss man teica savā iesaiņotajā uzvaras apļu grafikā. “Tam vajadzēja piegādāt divas lietas-AGI un PhD līmeņa izziņu, un tas nedeva nevienu no tām.” Turklāt, pēc viņa teiktā, šķietami nepietiekamais jaunais modelis ir pierādījums tam, ka Openai biļete uz AGI – datu un mikroshēmu komplektu mērogošana, lai padarītu tās sistēmas eksponenciāli gudrākas – var vairs nevar sadurt. Vienreiz Markusa uzskatus atkārtoja ievērojama AI kopienas daļa. Dienās pēc palaišanas GPT-5 izskatījās kā AI versija New Coke.
Sam Altmanam tā nav. Mēnesi pēc atklāšanas viņš dodas uz konferenču zāli uzņēmuma jaunajā galvenajā mītnē Sanfrancisko Misijas līča apkārtnē, labprāt paskaidrojot man un manai kolēģim Kylie Robison, ka GPT-5 ir viss, ko viņš bija norādījis, un ka viss ir labi viņa episkajos Agi meklējumos. “Vibas bija sava veida sliktas darbības sākšanas laikā,” viņš atzīst. “Wager tagad viņi ir lieliski.” Jā, lielsApvidū Tā ir taisnība, ka kritika ir nomirusi. Patiešām, uzņēmuma nesenais prāta izlaišanas rīks, lai ģenerētu iespaidīgu AI video slop, ir novirzījis stāstījumu no neapmierinošās GPT-5 debijas. Tomēr Altmana ziņojums ir tāds, ka naysayers atrodas nepareizajā vēstures pusē. Viņš uzstāj, ka ceļojums uz Agi joprojām ir uz ceļa.
Skaitļu spēle
Kritiķi varētu uzskatīt GPT-5 par AI vasaras mazo beigām, guess Altmans un komanda apgalvo, ka tā nostiprina AI tehnoloģiju kā neaizstājamu pasniedzēju, meklēšanas motoru nogalinošu informācijas avotu un, it īpaši, izsmalcinātu zinātnieku un kodētāju līdzstrādnieku. Altmans apgalvo, ka lietotāji to sāk redzēt. “GPT-5 ir pirmā reize, kad cilvēki ir:“ Svētais izdrāzt. Tas dara šo svarīgo fizikas gabalu ”. Vai arī biologs saka: “Oho, tas man vienkārši palīdzēja izdomāt šo lietu”, ”viņš saka. “Notiek kaut kas svarīgs, kas nenotika ar nevienu pirms GPT-5 modeli, kas ir sākums AI, palīdzot paātrināt jaunas zinātnes atklāšanas ātrumu.” (Openai nav minējis to, kas ir šie fiziķi vai biologi.)
Tātad, kāpēc miesa sākotnējā uztveršana? Altmans un viņa komanda ir izsvītrojuši vairākus iemeslus. Viens, viņi saka, ir tas, ka, tā kā GPT-4 nonāca ielās, uzņēmums piegādāja versijas, kas pašas bija pārveidojošas, it īpaši izsmalcinātos argumentācijas režīmus, ko viņi pievienoja. “Lēciens no 4 līdz 5 bija lielāks nekā lēciens no 3 līdz 4, ”saka Altmans.” Mums pa ceļam vienkārši bija daudz lietu. ” Openai prezidents Gregs Brokmans piekrīt: “Es neesmu šokēts, ka daudziem cilvēkiem tas bija [underwhelmed] reakcija, jo mēs esam parādījuši savu roku. ”
Openai arī saka, ka, tā kā GPT-5 ir optimizēts specializētiem lietojumiem, piemēram, zinātnes vai kodēšanas veikšanai, ikdienas lietotāji prasa laiku, lai novērtētu tā tikumus. “Lielākā daļa cilvēku nav fizikas pētnieki,” novēro Altmans. Kā skaidro Marks Čens, Openai pētījumu vadītājs, ja vien pats neesat matemātikas čaumalas, jums būs daudz vienalga, ka GPT-5 ierindojas Matemātikas olimpiešu pieciniekā, turpretī pagājušajā gadā sistēma ierindojās 200 labāko skaitā.
Runājot par maksu par to, kā GPT-5 parāda, ka mērogošana nedarbojas, Openai saka, ka tas nāk no pārpratuma. Atšķirībā no iepriekšējiem modeļiem, GPT-5 nesaņēma galveno progresu no masveidā lielākas datu kopas un daudz vairāk aprēķinu. Jaunais modelis ieguva savus ieguvumus no pastiprināšanas mācīšanās – paņēmiens, kas balstās uz ekspertu cilvēkiem, kas tai sniedz atgriezenisko saiti. Brockmans saka, ka Openai bija izstrādājuši savus modeļus līdz vietai, kur viņi varētu iegūt savus datus, lai darbinātu pastiprināšanas mācību ciklu. “Kad modelis ir mēms, viss, ko vēlaties darīt, ir apmācīt lielāku tā versiju,” viņš saka. “Kad modelis ir gudrs, jūs vēlaties to izlasīt. Jūs vēlaties trenēties uz saviem datiem.”