Home Tehnoloģija Šis “lētais” atvērtā koda AI modelis faktiski sadedzina jūsu aprēķinu budžetā

Šis “lētais” atvērtā koda AI modelis faktiski sadedzina jūsu aprēķinu budžetā

30
0

Vai vēlaties gudrāku ieskatu iesūtnē? Reģistrējieties mūsu iknedēļas biļeteniem, lai iegūtu tikai to, kas ir svarīgi uzņēmuma AI, datu un drošības vadītājiem. Abonēt tūlīt


Visaptverošs Jauns pētījums ir atklājis, ka atvērtā koda mākslīgā intelekta modeļi patērē ievērojami vairāk skaitļošanas resursu nekā viņu slēgtā avota konkurenti, veicot identiskus uzdevumus, potenciāli graujot to izmaksu priekšrocības un pārveidojot to, kā uzņēmumi novērtē AI izvietošanas stratēģijas.

Pētījums, ko veica AI firma Nous pētījumiatklāja, ka atvērtā svara modeļi izmanto no 1,5 līdz 4 reizes vairāk žetonu-AI aprēķina pamata vienības-nekā slēgti modeļi, piemēram, no Openai un AntropisksApvidū Vienkāršiem zināšanu jautājumiem plaisa dramatiski palielinājās, un daži atvērti modeļi izmantoja līdz 10 reizes vairāk žetonu.

“Atvērtā svara modeļos tiek izmantoti 1,5–4 × vairāk žetonu nekā slēgti (līdz 10 × vienkāršiem zināšanu jautājumiem), padarot tos dažreiz dārgākus uz vienu vaicājumu, neskatoties uz zemākām izmaksām par vienu likumu,” pētnieki rakstīja trešdien publicētajā ziņojumā.

Rezultāti izaicina dominējošo pieņēmumu AI nozarē, ka atvērtā koda modeļi piedāvā skaidras ekonomiskās priekšrocības salīdzinājumā ar patentētām alternatīvām. Kaut arī atvērtā pirmkoda modeļi parasti maksā mazāk par marķieri, pētījums liecina, ka šo priekšrocību var “viegli kompensēt, ja tiem ir nepieciešami vairāk žetonu, lai saprastu par konkrēto problēmu”.


AI mērogošana sasniedz savas robežas

Strāvas robežas, pieaugošās marķiera izmaksas un secinājumu kavēšanās ir uzņēmuma AI pārveidošana. Pievienojieties mūsu ekskluzīvajam salonam, lai atklātu, kā ir labākās komandas:

  • Enerģijas pārvēršana par stratēģisku priekšrocību
  • Arhitektējot efektīvus secinājumus par reālu caurlaidspējas pieaugumu
  • Konkurences IA atbloķēšana ar ilgtspējīgām AI sistēmām

Nostipriniet savu vietu, lai paliktu priekšā:


AI reālās izmaksas: kāpēc “lētāki” modeļi var sabojāt jūsu budžetu

Pētījumā tika pārbaudīts 19 dažādi AI modeļi Trīs uzdevumu kategorijās: pamatzināšanu pamati, matemātiskās problēmas un loģiskās mīklas. Komanda izmērīja “marķiera efektivitāti” – cik daudz skaitļošanas vienību modeļos izmanto attiecībā pret to risinājumu sarežģītību – metriku, kas ir saņēmusi nelielu sistemātisku pētījumu, neskatoties uz tā nozīmīgajām ietekmēm izmaksām.

“Token efektivitāte ir kritiska metrika vairāku praktisku iemeslu dēļ,” atzīmēja pētnieki. “Lai arī atvērtā svara modeļu mitināšana var būt lētāka, šo izmaksu priekšrocību var viegli kompensēt, ja tiem ir nepieciešami vairāk žetonu, lai saprastu par konkrēto problēmu.”

Atvērtā avota AI modeļi izmanto līdz 12 reizes vairāk skaitļošanas resursu nekā visefektīvākie slēgtie modeļi pamatzināšanu jautājumos. (Kredīts: Nous Analysis)

Neefektivitāte ir īpaši izteikta lieliem argumentācijas modeļiem (LRM), kas izmanto pagarinātu “Domas ķēdes”Lai atrisinātu sarežģītas problēmas. Šie modeļi, kas izstrādāti, lai pārdomātu problēmas soli pa solim, var patērēt tūkstošiem žetonu, kas apdomā vienkāršus jautājumus, kuriem būtu nepieciešams minimāls aprēķins.

Pamatzināšanu jautājumiem, piemēram, “kāda ir Austrālijas galvaspilsēta?” Pētījumā tika atklāts, ka argumentācijas modeļi tērē “simtiem žetonu, apdomājot vienkāršus zināšanu jautājumus”, uz kuriem varētu atbildēt vienā vārdā.

Kuri AI modeļi faktiski piegādā sprādzienu jūsu buks

Pētījums atklāja krasas atšķirības starp modeļa nodrošinātājiem. Openai modeļi, it īpaši tā O4-Mini un nesen atbrīvots atvērtā koda GPT-oss Varianti, kas pierādīja ārkārtas marķiera efektivitāti, īpaši matemātiskām problēmām. Pētījumā tika atklāts, ka Openai modeļi “izceļas ar galēju marķiera efektivitāti matemātikas problēmās”, izmantojot ne vairāk kā trīs reizes mazāk žetonu nekā citi komerciālie modeļi.

Starp atvērtā koda iespējām, Nvidia’s lama-3.3-nemotrons-super-49b-v1 Izveidojās kā “visvairāk efektīvā marķiera atvērtā svara modelis visās jomās”, savukārt jaunāki modeļi no tādiem uzņēmumiem kā maģistrāle parādīja “ārkārtīgi augstu marķiera izmantošanu” kā novirzes.

Efektivitātes atšķirība ievērojami atšķīrās pēc uzdevuma veida. Kaut arī atvērtie modeļi matemātiskām un loģiskām problēmām izmantoja aptuveni divreiz vairāk žetonu, atšķirība, kas tika izmantota vienkāršiem zināšanu jautājumiem, kur efektīvai argumentācijai vajadzētu būt nevajadzīgai.

Openai jaunākie modeļi sasniedz viszemākās izmaksas par vienkāršiem jautājumiem, savukārt dažas atvērtā koda alternatīvas var maksāt ievērojami vairāk, neskatoties uz zemākām cenām. (Kredīts: Nous Analysis)

Kas uzņēmuma vadītājiem jāzina par AI skaitļošanas izmaksām

Rezultātiem ir tūlītēja ietekme uz uzņēmuma AI ieviešanu, kurā skaitļošanas izmaksas var strauji mērogot, izmantojot lietošanu. Uzņēmumi, kas novērtē AI modeļus, bieži koncentrējas uz precizitātes etaloniem un cenu noteikšanu uz vienu taktu, taču tie var ņemt vērā kopējās skaitļošanas prasības reālās pasaules uzdevumiem.

“Jo labāka slēgtā svara modeļu marķiera efektivitāte bieži kompensē šo modeļu augstāku API cenu noteikšanu,” pētnieki atklāja, analizējot kopējās secinājumu izmaksas.

Pētījums arī atklāja, ka slēgtā avota modeļa nodrošinātāji, šķiet, aktīvi optimizē efektivitāti. “Slēgtā svara modeļi ir iteratīvi optimizēti, lai izmantotu mazāk žetonu, lai samazinātu secinājumu izmaksas,” savukārt atvērtā pirmkoda modeļi ir “palielinājuši savu marķiera izmantošanu jaunākām versijām, iespējams, atspoguļojot prioritāti labākai argumentācijas veiktspējai.”

Skaitļošanas pieskaitīšana AI pakalpojumu sniedzējiem dramatiski mainās, un daži modeļi izmanto vairāk nekā 1000 žetonu iekšējai argumentācijai par vienkāršiem uzdevumiem. (Kredīts: Nous Analysis)

Kā pētnieki uzlauza kodu AI efektivitātes mērīšanā

Pētniecības grupa saskārās ar unikālām problēmām, lai izmērītu efektivitāti dažādās modeļa arhitektūrās. Daudzi slēgta avota modeļi neatklāj savus neapstrādātos spriešanas procesus, tā vietā nodrošinot saspiestus to iekšējo aprēķinu kopsavilkumus, lai neļautu konkurentiem kopēt savus paņēmienus.

Lai to risinātu, pētnieki izmantoja pabeigšanas žetonus – kopējās skaitļošanas vienības, par kurām rēķina par katru vaicājumu – kā starpniecības centienus. Viņi atklāja, ka “jaunākie slēgtā avota modeļi nedalīsies ar savām neapstrādātām spriešanas pēdām” un tā vietā “izmantojiet mazākas valodas modeļus, lai pārrakstītu domu ķēdi kopsavilkumos vai saspiestos attēlojumos”.

Pētījuma metodika ietvēra pārbaudi ar labi zināmu problēmu modificētām versijām, lai samazinātu iegaumētu risinājumu ietekmi, piemēram Amerikas ielūguma matemātikas pārbaude (AIME)Apvidū

Dažādi AI modeļi parāda atšķirīgas attiecības starp aprēķinu un izvadi, dažiem pakalpojumu sniedzējiem saspiežot argumentācijas pēdas, guess citi sniedz pilnīgu informāciju. (Kredīts: Nous Analysis)

AI efektivitātes nākotne: kas notiks tālāk

Pētnieki norāda, ka marķiera efektivitātei vajadzētu kļūt par galveno optimizācijas mērķi līdztekus precizitātei turpmākai modeļa izstrādei. “Dīvaināka gultiņa ļaus arī efektīvāk izmantot kontekstu un var novērst konteksta degradāciju izaicinošu spriešanas uzdevumu laikā,” Viņi rakstījaApvidū

Openai atvērtā koda izlaišana GPT-OSS modeļikas parāda mūsdienīgu efektivitāti ar “brīvi pieejamu gultiņu”, varētu kalpot par atskaites punktu citu atvērtā pirmkoda modeļu optimizēšanai.

Pilnīga pētījumu datu kopa un novērtēšanas kods ir Pieejams vietnē githubļaujot citiem pētniekiem apstiprināt un paplašināt atklājumus. Tā kā AI nozare sacenšas par jaudīgākām spriešanas iespējām, šis pētījums liek domāt, ka reālā konkurence var nebūt par to, kurš var veidot visgudrāko AI, guess kurš var veidot visefektīvāko.

Galu galā pasaulē, kurā katrs marķieris ir izšķērdākais modelis, var būt cena ārpus tirgus neatkarīgi no tā, cik labi viņi var domāt.


avots