Home Tehnoloģija Atvērto avotu AI modeļi ilgtermiņā var būt dārgāki, pētījumu atklājumi var būt

Atvērto avotu AI modeļi ilgtermiņā var būt dārgāki, pētījumu atklājumi var būt

33
0

Tā kā arvien vairāk uzņēmumu pieņem AI, izvēlēties, ar kuru modeli iet, ir galvenais lēmums. Kaut arī sākotnēji atklāti modeļi var šķist lētāki, jauns pētījums brīdina, ka šie ietaupījumi var ātri iztvaikot, sakarā ar nepieciešamo papildu skaitļošanas jaudu.

Faktiski atvērtā koda AI modeļi, kas veic ievērojami vairāk skaitļošanas resursu nekā viņu slēgtā avota konkurenti, veicot tos pašus uzdevumus, saskaņā ar a izpētīt Ceturtdien publicēja Nous Analysis.

Pētnieki pārbaudīja desmitiem AI modeļu, ieskaitot Google un Openai slēgtās sistēmas, kā arī atvērtā pirmkoda modeļus no DeepSeek un Magistral. Viņi izmērīja, cik daudz skaitļošanas pūles bija nepieciešamas, lai veiktu identiskus uzdevumus trīs kategorijās: vienkāršas zināšanu jautājumi, matemātikas problēmas un loģiskās mīklas.

Lai to izdarītu, viņi izmantoja to marķieru skaitu, ko katrs modelis tika izmantots, lai atrisinātu un atbildētu uz jautājumiem, kas saistīti ar patērēto resursu skaitļošanu.

“Atvērtā svara modeļi izmanto 1,5–4 × vairāk žetonu nekā slēgti-un līdz 10 × vienkāršiem zināšanu jautājumiem-padarot tos dažreiz dārgākus vaicājumus, neskatoties uz zemākām izmaksām uz vienu,” rakstīja pētījuma autori.

Kāpēc svarīgi ir efektivitāte

AI marķieris ir teksts vai dati – tas varētu būt vārds, vārda daļa vai pat pieturzīmes -, ko modeļi izmanto, lai izprastu valodu. Modeļi apstrādā un ģenerē tekstu vienu marķieri vienlaikus, tāpēc jo vairāk žetonu viņi izmanto, jo lielāka skaitļošanas jauda un laiks uzdevumam nepieciešams.

Tā kā vairums slēgto avotu modeļu neatklāj savu neapstrādāto spriešanas procesu vai domu ķēdi (COT), pētnieki izmērīja savu skaitļošanas efektivitāti, saskaitot marķierus, kurus viņi izmantoja. Tā kā modeļiem tiek rēķināti ar kopējiem izvades žetoniem, ko izmanto to spriešanas procesā, un galīgās atbildes izvadīšana, pabeigšanas žetoni kalpo kā pilnvaras pūlēm, kas vajadzīgas reakcijas sniegšanai.

Tas ir svarīgs apsvērums uzņēmumiem, kas izmanto AI daudzu iemeslu dēļ.

“Pirmkārt, kaut arī atvērtā svara modeļu mitināšana var būt lētāka, šo izmaksu priekšrocību var viegli kompensēt, ja tiem ir nepieciešami vairāk žetonu, lai saprastu par konkrēto problēmu,” rakstīja pētnieki. “Otrkārt, palielināts žetonu skaits izraisīs ilgāku paaudzes laiku un palielinās latentumu.”

Slēgti modeļi bija skaidri uzvarētāji

Pētījumā atklājās, ka atvērtie modeļi konsekventi izmanto vairāk žetonu nekā slēgti modeļi tiem pašiem uzdevumiem, dažreiz trīs reizes vairāk par vienkāršiem zināšanu jautājumiem. Plaisa sašaurinājās līdz mazāk nekā divreiz matemātikas un loģikas problēmām.

“Slēgti modeļi (Openai, Grok-4) optimizē mazāk žetonu, lai samazinātu izmaksas, savukārt atvērtie modeļi (DeepSeek, Qwen) izmanto vairāk žetonu, iespējams, labākas spriešanas dēļ,” rakstīja pētījuma autori.

Starp atvērtiem modeļiem visefektīvākais bija LMAM-3,3-Nemotron-Tremendous-49B-V1, savukārt maģistrālie modeļi bija visefektīvākie.

Arī Openai modeļi bija izcili. Gan tā O4-mini, gan jaunie atklātā svara GPT-OSS modeļi parādīja iespaidīgu marķiera efektivitāti, īpaši attiecībā uz matemātikas problēmām.

Pētnieki atzīmēja, ka Openai GPT-OSS modeļi ar kodolīgām parastajām ķēdēm varētu kalpot par etalonu, lai uzlabotu marķiera efektivitāti citos atvērtos modeļos.

avots