Pat kā bažas un skepse pieaug ASV mākslīgā intelekta starta uzņēmuma OpenAI izveides stratēģija un lielas tēriņu saistības, Ķīnas atvērtā pirmkoda mākslīgā intelekta nodrošinātāji saasina konkurenci, un viens ir pat sasniedzis OpenAI vadošo, maksas patentēto modeli GPT-5 galvenajos trešās puses veiktspējas etalonos ar jaunu, bezmaksas modeli.
Ķīnas AI starta programma Moonshot AI jaunais Kimi K2 domāšanas modeliskas tika izdots šodien, ir apsteidzis gan patentētus, gan atklātā svara konkurentus, lai iegūtu augstāko pozīciju argumentācijas, kodēšanas un aģentu rīku etalonos.
Neskatoties uz to, ka modelis ir pilnībā atvērts, tagad tas pārspēj OpenAI GPT-5, Anthropic Claude Sonnet 4.5 (domāšanas režīms) un xAI Grok-4 vairākos standarta novērtējumos — tas ir atvērto AI sistēmu konkurētspējas novirzes punkts.
Izstrādātāji var piekļūt modelim, izmantojot platform.moonshot.ai un kimi.com; svari un kods tiek mitināti Apskāva seja. Atvērtajā laidienā ir iekļauti API tērzēšanai, argumentācijai un vairāku rīku darbplūsmām.
Lietotāji var izmēģināt Kimi K2 Pondering tieši, izmantojot savu ChatGPT līdzīga vietņu konkurents un tālāk arī apskaujošas sejas telpa.
Modificēta standarta atvērtā pirmkoda licence
Moonshot AI oficiāli ir izlaidusi Kimi K2 Pondering zem a Modificēta MIT licence uz apskaujošās sejas.
Licence piešķir visas komerciālās un atvasinātās tiesības — tas nozīmē, ka atsevišķi pētnieki un izstrādātāji, kas strādā uzņēmuma klientu vārdā, var tai brīvi piekļūt un izmantot to komerciālos lietojumos, guess pievieno vienu ierobežojumu:
"Ja programmatūra vai kāds atvasināts produkts kalpo vairāk nekā 100 miljoni aktīvo lietotāju mēnesī vai ģenerē ieņēmumus vairāk nekā 20 miljonus USD mēnesī, Izstrādātājam produkta lietotāja saskarnē ir skaidri jāparāda “Kimi K2”."
Lielākajai daļai pētniecības un uzņēmumu lietojumprogrammu šī klauzula darbojas kā viegla attiecinājuma prasība, vienlaikus saglabājot standarta MIT licencēšanas brīvības.
Tas padara K2 Pondering par vienu no pašlaik pieejamākajiem pierobežas klases modeļiem, kas ir licencēti.
Jauns etalona līderis
Kimi K2 Pondering ir Combination-of-Consultants (MoE) modelis, kas veidots, pamatojoties uz vienu triljonu parametru, no kuriem 32 miljardi tiek aktivizēti katram secinājumam.
Tas apvieno ilgtermiņa spriešanu ar strukturētu rīku izmantošanu, izpildot līdz 200–300 secīgu rīku izsaukumu bez cilvēka iejaukšanās.
Saskaņā ar Moonshot publicētajiem testa rezultātiem K2 Pondering sasniedza:
-
44,9 % ieslēgts Cilvēces pēdējais eksāmens (HLE)vismodernākais rezultāts;
-
60,2 % ieslēgts BrowseCompaģents tīmekļa meklēšanas un argumentācijas assessments;
-
71,3 % ieslēgts SWE-Bench Verified un 83,1 % ieslēgts LiveCodeBench v6atslēgas kodēšanas novērtējumi;
-
56,3 % ieslēgts Seal-0etalons reālās pasaules informācijas izguvei.
Veicot šos uzdevumus, K2 Pondering konsekventi pārspēj GPT-5 atbilstošos rādītājus un pārspēj iepriekšējo atklātā svara līderi MiniMax-M2, kuru tikai dažas nedēļas iepriekš izlaida Ķīnas konkurents MiniMax AI.
Atvērtais modelis pārspēj patentētās sistēmas
GPT-5 un Claude Sonnet 4.5 Pondering joprojām ir vadošie patentētie “domāšanas” modeļi.
Tomēr tajā pašā etalonu komplektā K2 Pondering aģentu spriešanas rādītāji pārsniedz abus: piemēram, pārlūkprogrammā BrowseComp atvērtā modeļa 60,2 % pārliecinoši pārspēj GPT-5 54,9 % un Claude 4,5 24,1 %.
K2 Pondering pārspēj arī GPT-5 collas GPQA dimants (85,7 % pret 84,5 %) un saskaņo to ar tādiem matemātiskās spriešanas uzdevumiem kā, piemēram, AIME 2025 un HMMT 2025.
Tikai noteiktās smagā režīma konfigurācijās, kur GPT-5 apkopo vairākas trajektorijas, patentētais modelis atgūst paritāti.
Tas, ka Moonshot pilnībā atvērtā svara izlaidums var sasniegt vai pārsniegt GPT-5 rādītājus, iezīmē pagrieziena punktu. Plaisa starp slēgtām robežām sistēmām un publiski pieejamiem modeļiem ir faktiski sabrukusi augstākās klases argumentācijai un kodēšanai.
Pārspējot MiniMax-M2: iepriekšējo atvērtā pirmkoda etalonu
Kad VentureBeat tikai pirms pusotras nedēļas izveidoja MiniMax-M2 profilu, tas tika slavēts kā “jaunais atvērtā pirmkoda LLM karalis”, kas sasniedza labākos rezultātus starp atvērtā svara sistēmām:
-
τ²-Sols 77.2
-
BrowseComp 44.0
-
FinSearchComp-global 65.5
-
SWE-Bench Verified 69.4
Šie rezultāti lika MiniMax-M2 gandrīz GPT-5 līmeņa iespējām aģentu rīku lietošanā. Tomēr Kimi K2 Pondering tagad tos aptumšo ar platām malām.
Tā BrowseComp rezultāts 60,2% pārsniedz M2 44,0%, un tā SWE-Bench Verified 71,3% pārsniedz M2 69,4%. Pat veicot finansiālus apsvērumus, piemēram, FinSearchComp-T3 (47,4 %), K2 Pondering darbojas salīdzināmi, vienlaikus saglabājot izcilu vispārējas nozīmes spriešanu.
Tehniski abos modeļos aprēķinu efektivitātes nodrošināšanai ir izmantotas retas Combination-of-Consultants arhitektūras, taču Moonshot tīkls aktivizē vairāk ekspertu un izvieto uzlabotas kvantēšanas apmācības (INT4 QAT).
Šis dizains divkāršo secinājumu veikšanas ātrumu salīdzinājumā ar standarta precizitāti, nesamazinot precizitāti — tas ir ļoti svarīgi ilgām “domāšanas simbola” sesijām, kas sasniedz 256 000 konteksta logus.
Aģentiskā spriešana un rīku izmantošana
K2 Pondering definējošās spējas slēpjas tās skaidrā spriešanas izsekojamībā. Modelis izvada palīglauku argumenting_content, kas atklāj starpposma loģiku pirms katras pēdējās atbildes. Šī caurspīdīgums saglabā saskaņotību ilgos vairāku apgriezienu uzdevumos un daudzpakāpju rīku izsaukumos.
Moonshot publicētā atsauces ieviešana parāda, kā modelis autonomi veic “ikdienas ziņu ziņojuma” darbplūsmu: izsauc datuma un tīmekļa meklēšanas rīkus, analizē izgūto saturu un veido strukturētu izvadi, vienlaikus saglabājot iekšējo argumentācijas stāvokli.
Šī pilnīga autonomija ļauj modelim plānot, meklēt, izpildīt un sintezēt pierādījumus simtiem darbību, atspoguļojot jauno “aģentiskā AI” sistēmu klasi, kas darbojas ar minimālu uzraudzību.
Efektivitāte un piekļuve
Neskatoties uz triljonu parametru skalu, K2 Pondering izpildlaika izmaksas joprojām ir pieticīgas. Moonshot sarakstu lietojums:
-
0,15 ASV dolāri / 1 miljons marķieru (kešatmiņas trāpījums)
-
0,60 ASV dolāri / 1 miljons marķieri (nepietiekama kešatmiņa)
-
$2,50 / 1 miljons marķieru izvade
Šīs likmes ir konkurētspējīgas pat ar MiniMax-M2 0,30 ASV dolāru ieejas / 1,20 ASV dolāru izvades cenām un par lielumu zem GPT-5 (1,25 ASV dolāru ievade / 10 ASV dolāru izvade).
Salīdzinošais konteksts: Atvērtā svara paātrinājums
M2 un K2 Pondering straujā pēctecība parāda, cik ātri atvērtā pirmkoda pētniecība pārņem robežsistēmas. MiniMax-M2 parādīja, ka atvērtie modeļi var tuvoties GPT-5 klases aģenta iespējām ar nelielu daļu no aprēķina izmaksām. Moonshot tagad ir attīstījis šo robežu tālāk, virzot atklātos svarus ārpus paritātes uz tiešu vadību.
Abi modeļi paļaujas uz retu aktivizēšanu efektivitātes nodrošināšanai, guess K2 Pondering lielāks aktivizācijas skaits (32 B pret 10 B aktīviem parametriem) nodrošina spēcīgāku argumentācijas precizitāti visos domēnos. Tā pārbaudes laika mērogošana — paplašina “domāšanas marķierus” un rīku izsaukšanas pagriezienus — nodrošina izmērāmu veiktspējas pieaugumu bez pārkvalificēšanās, kas MiniMax-M2 vēl nav novērota.
Tehniskā perspektīva
Moonshot ziņo, ka K2 Pondering atbalsta vietējais INT4 secinājums un 256 k-token konteksti ar minimālu veiktspējas pasliktināšanos. Tās arhitektūrā ir integrēta kvantēšana, paralēla trajektoriju apkopošana (“smagais režīms”) un ekspertu kombinācijas maršrutēšana, kas pielāgota argumentācijas uzdevumiem.
Praksē šīs optimizācijas ļauj K2 Pondering uzturēt sarežģītas plānošanas cilpas — koda kompilēšana–testēšana–labošana, meklēšana–analīze–kopsavilkums simtiem rīku izsaukumu. Šī iespēja ir pamatā tās izcilajiem rezultātiem pārlūkprogrammās BrowseComp un SWE-Bench, kur spriešanas nepārtrauktība ir izšķiroša.
Milzīga ietekme uz AI ekosistēmu
Atvērto un slēgto modeļu konverģence augstākajā līmenī norāda uz strukturālām izmaiņām AI ainavā. Uzņēmumi, kas kādreiz paļāvās tikai uz patentētām API, tagad var izvietot atvērtas alternatīvas, kas atbilst GPT-5 līmeņa argumentācijai, vienlaikus saglabājot pilnīgu svaru, datu un atbilstības kontroli.
Moonshot atklātās publicēšanas stratēģija seko precedentam, ko izveidoja DeepSeek R1, Qwen3, GLM-4.6 un MiniMax-M2, guess paplašina to līdz pilnīgai aģentu spriešanai.
Akadēmiskajiem un uzņēmumu izstrādātājiem K2 Pondering nodrošina gan caurspīdīgumu, gan savietojamību — iespēju pārbaudīt argumentācijas pēdas un precizēt domēna specifisko aģentu veiktspēju.
K2 Pondering ienākšana liecina, ka Moonshot — a jauns jaunuzņēmums, kas dibināts 2023. gadā ar dažu Ķīnas lielāko lietotņu un tehnoloģiju uzņēmumu investīcijām — ir šeit, lai spēlētu pieaugošā konkurencē, un tas notiek laikā, kad arvien vairāk tiek pārbaudīta AI lielāko spēlētāju finansiālā ilgtspēja.
Tikai pirms dienas OpenAI finanšu direktore Sāra Frāra izraisīja strīdus ierosinot vietnē WSJ Tech Live gadījumā, ja ASV valdībai galu galā varētu būt nepieciešams nodrošināt uzņēmuma vairāk nekā 1,4 triljonu ASV dolāru aprēķinu un datu centru saistībām — komentārs tiek plaši interpretēts kā aicinājums nodrošināt nodokļu maksātāju nodrošinātas aizdevuma garantijas.
Lai gan Friar vēlāk precizēja, ka OpenAI nemeklēja tiešu federālo atbalstu, šī epizode atkal izraisīja debates par AI kapitāla izdevumu apjomu un koncentrāciju.
Tā kā OpenAI, Microsoft, Meta un Google cenšas nodrošināt ilgtermiņa mikroshēmu piegādi, kritiķi brīdina par neilgtspējīgu investīciju burbuli un “AI bruņošanās sacensību”, ko vairāk virza stratēģiskas bailes, nevis komerciāla atdeve. "uzspridzināt" un sagraut visu pasaules ekonomiku, ja rodas vilcināšanās vai tirgus nenoteiktība, jo tagad ir veikti tik daudzi darījumi un novērtējumi, gaidot, ka turpināsies lielas AI investīcijas un milzīgi atdevi.
Ņemot to vērā, Moonshot AI un MiniMax atvērtā svara izlaidumi rada lielāku spiedienu uz ASV patentētajām AI firmām un to atbalstītājiem, lai attaisnotu investīciju apjomu un ceļu uz rentabilitāti.
Ja uzņēmuma klients var tikpat viegli iegūt salīdzināmu vai labāku veiktspēju no bezmaksas, atvērtā pirmkoda ķīniešu AI modeļa, nekā tas tiek darīts ar maksas, patentētiem AI risinājumiem, piemēram, OpenAI GPT-5, Anthropic Claude Sonnet 4.5 vai Google Gemini 2.5 Professional — kāpēc viņiem būtu jāturpina maksāt, lai piekļūtu patentētajiem modeļiem? Jau tagad Silīcija ielejas izcilnieki, piemēram, Airbnb, ir saraukuši uzacis, atzīstot, ka ir smagi izmantojot ķīniešu atvērtā pirmkoda alternatīvas, piemēram, Alibaba Qwen, izmantojot OpenAI patentētos piedāvājumus.
Investoriem un uzņēmumiem šie notikumi liecina, ka augstākās klases AI iespējas vairs nav sinonīms augstas klases kapitālizdevumiem. Vismodernākās spriešanas sistēmas tagad var nākt nevis no uzņēmumiem, kas būvē giga mēroga datu centrus, guess gan no pētniecības grupām, kas optimizē arhitektūras un kvantificē efektivitāti.
Šajā ziņā K2 Pondering dominējošais etalons nav tikai tehnisks pavērsiens — tas ir stratēģisks pavērsiens, kas pienāk brīdī, kad AI tirgus lielākais jautājums ir mainījies. cik spēcīgi modeļi var kļūt uz kas var atļauties tos uzturēt.
Ko tas nozīmē turpmākajiem uzņēmumiem
Dažu nedēļu laikā pēc MiniMax-M2 pacelšanās Kimi K2 Pondering ir apsteidzis to — kopā ar GPT-5 un Claude 4.5 — gandrīz visos argumentos un aģentu etalonos.
Modelis parāda, ka atvērtā svara sistēmas var tagad atbilst vai pārspēj patentētus robežmodeļus gan spējā, gan efektivitātē.
AI pētniecības kopienai K2 domāšana ir vairāk nekā cits atvērts modelis: tas liecina, ka robeža ir kļuvusi par sadarbību.
Mūsdienās pieejamais spriešanas modelis ar vislabāko veiktspēju nav slēgts komerciāls produkts, guess gan atvērtā pirmkoda sistēma, kas pieejama ikvienam.











