Home Tehnoloģija Mistral pirmais spriešanas modelis Magistral tiek palaists ar lielu un mazu Apache...

Mistral pirmais spriešanas modelis Magistral tiek palaists ar lielu un mazu Apache 2.0 versiju

11
0

Pievienojieties pasākumam, kuru uzņēmuma vadītāji uzticas gandrīz divas desmitgades. VB Remodel apvieno cilvēkus, kas veido reālu uzņēmumu AI stratēģiju. Uzziniet vairāk


Eiropas AI spēkstacija Mistral šodien uzsāka maģistrujauna lielo valodu modeļu (LLMS) saime, kas iezīmē pirmo no uzņēmuma, kas iekļūst arvien konkurētspējīgākā “spriešanas” telpā, vai modeļiem, kas prasa laiku, lai pārdomātu viņu domāšanu, lai noķertu kļūdas un atrisinātu sarežģītākus uzdevumus nekā pamata tekstu balstīti LLMS.

Paziņojumā ir paredzēts stratēģisks divkāršs izlaidums: jaudīgs, patentēts maģistra līdzeklis uzņēmuma klientiem un, it īpaši 24 miljardu parametru atvērtā koda versija, Magistral Small.

Šķiet, ka pēdējais izlaidums tiek aprēķināts, lai pastiprinātu uzņēmuma apņemšanos ievērot pamatus pēc laika, kad tā saskārās ar kritiku par to, lai viņi varētu ieslēgt slēgtākus, patentētus modeļus, piemēram, tā vidi 3 uzņēmumiem, kas tika palaisti 2025. gada maijā.

Atgriešanās pie atvērtā koda saknēm

Virzienā, kuru neapšaubāmi svinēs izstrādātāji un plašāka AI kopiena, Mistral atbrīvo mazu maģistrāle saskaņā ar pieļaujamo atvērtā pirmkoda Apache 2.0 licenciApvidū

Šī ir būtiska detaļa. Atšķirībā no ierobežotākām licencēm, Apache 2.0 ļauj ikvienam brīvi izmantot, modificēt un izplatīt modeļa avota kodu pat komerciāliem mērķiem.

Tas dod iespēju gan jaunizveidotiem uzņēmumiem, gan izveidotiem uzņēmumiem veidot un izvietot savas lietojumprogrammas papildus Mistral jaunākās arhitektūras arhitektūrai, bez licencēšanas maksām vai bailēm no pārdevēja ieslēgšanas.

Šī atvērtā pieeja ir īpaši nozīmīga, ņemot vērā kontekstu. Kamēr Mistral savu reputāciju veidoja ar jaudīgiem atvērtiem modeļiem, nesenais Medium 3 izlaišana kā tīri patentēts piedāvājums izraisīja bažas no dažām atvērtā koda kopienas ceturkšņiem, kuri uztraucās, ka uzņēmums virzās uz slēgtāku ekosistēmu, līdzīgu konkurentiem, piemēram, Openai.

Magistral Small atbrīvošana saskaņā ar tik pieļaujamo licenci kalpo kā spēcīgs pretstāvu, kas atkārtoti apstiprina Mistralas centību, bruņojot atvērto kopienu ar visprogresīvākajiem instrumentiem.

Konkurences sniegums pret milzīgiem ienaidniekiem

Mistral ne tikai runā par lielu spēli; Tas nāca ar kvītīm. Uzņēmums izlaida etalonu komplektu Magistral Medium, pret savu priekšgājēju, Mistral-Medium 3 un konkurentiem no DeepSeek. Rezultāti parāda modeli, kas ir nikni konkurētspējīgs argumentācijas arēnā.

Par AIME-24 matemātikas etalonu maģistrāle-Medijs iegūst iespaidīgu 73,6% precizitāti, kaklu un kaklu ar savu priekšgājēju un ievērojami pārspējot DeepSeek modeļus. Izmantojot vairākuma balsošanu (paņēmiens, kurā modelis ģenerē vairākas atbildes un tiek izvēlēts visizplatītākais), tā sniegums AIME-24 pāriet uz satriecošiem 90%.

Jaunajam modelim ir arī savi citi prasīgie testi, ieskaitot GPQA Diamond, absolventa līmeņa jautājumu, kas atbild, un LiveCodeBench, lai kodētu izaicinājumus.

Kaut arī DeepSEEK-V3 parāda spēcīgu sniegumu dažos etalonos, maģistrāles un medijs pastāvīgi pierāda sevi kā augstākā līmeņa spriešanas modeli, apstiprinot Mistral apgalvojumus par tā uzlabotajām iespējām.

Uzņēmuma jauda

Kamēr Magistral Small ir paredzēts atvērtā koda pasaulē, etalona validētais Maģistrāle ir vērsts uz uzņēmumu.

Tas ir pieņemams, izmantojot Mistral’s LE tērzēšanas interfeisu un La PlateForme API, tas nodrošina augstākā līmeņa sniegumu, kas nepieciešams misijai kritiskiem uzdevumiem.

Mistral padara šo modeli pieejamu lielākajās mākoņu platformās, ieskaitot Amazon Sagemaker, ar Azure AI, IBM Watsonx un Google Cloud Market.

Šī divkāršās darbības stratēģija ļauj Mistral iegūt savu kūku un arī to ēst: dinamiskas ekosistēmas veicināšana ap atvērtajiem modeļiem, vienlaikus gūstot peļņu no visspēcīgākās, veiktspējas pārbaudītās tehnoloģijas korporatīvajiem klientiem.

Izmaksu salīdzinājums

Runājot par izmaksām, Mistral pozicionē maģistrāles vidi kā atšķirīgu, premium piedāvājumu, pat salīdzinot ar saviem modeļiem.

Pie 2 USD par miljonu ievades žetonu un USD 5 par miljonu izlaides žetonu tas nozīmē ievērojamu cenu pieaugumu no vecāka Mistral Medium 3, kas maksā tikai 0,40 USD par ievadi un 2 USD par izlaidi.

Tomēr, ja tas ir pret saviem ārējiem konkurentiem, Magistral Medium cenu noteikšanas stratēģija šķiet ļoti agresīva. Tās ievades izmaksas atbilst Openai jaunākā modeļa un atrodas Gemini 2,5 Professional diapazonā, tomēr tā 5 USD izlaides cena ievērojami samazina abus, kuru cena ir attiecīgi 8 USD un vairāk par 10 USD.

Tiesneša API izmaksas salīdzinājumā ar citiem vadošajiem LLM spriedējiem. Kredīts: VentureBeat, kas izgatavots ar Google Gemini 2.5 Professional (priekšskatījums)

Lai arī tas ir ievērojami dārgāks nekā specializēti modeļi, piemēram, DeepSeek-Resoner, tas ir lieluma pasūtījums lētāks nekā Anthropic flagmanis Claude Opus 4, padarot to par pārliecinošu vērtības piedāvājumu klientiem, kuri meklē mūsdienīgāko argumentāciju, nemaksājot absolūti augstākās tirgus cenas.

Argumentācija, kuru varat apskatīt, saprast un izmantot

Mistral virza trīs galvenās priekšrocības ar maģistrāles līniju: caurspīdīgumu, daudzvalodību un ātrumu.

Atbrīvojoties no daudzu AI modeļu “melnās kastes” rakstura, Magistral ir paredzēts, lai iegūtu izsekojamu “pārdomu ķēdi”. Tas lietotājiem ļauj sekot modeļa loģiskajam ceļam, kas ir kritiska īpašība augstas likmes profesionālajām jomām, piemēram, likumiem, finansēm un veselības aprūpei, kur secinājumiem jābūt pārbaudāmiem.

Turklāt šīs spriešanas iespējas ir globālas. Mistral uzsver modeļa “daudzvalodu veiklību”, izceļot augstas nozīmes sniegumu valodās, ieskaitot franču, spāņu, vācu, itāļu, arābu, krievu un vienkāršotu ķīniešu valodu.

Veiktspējas frontē uzņēmums apgalvo par būtisku ātruma palielinājumu. Tiek ziņots, ka jauna “Suppose Mode” un “Flash Solutions” ​​funkcija LE tērzēšanā ļauj Magistral Media sasniegt līdz 10 reizes lielāku konkurentu marķiera caurlaidspēju, atvieglojot reāllaika spriešanu tādā mērogā, kas iepriekš neredzēts.

No koda gen līdz radošai stratēģijai un ārpus tās

Pieteikumi par maģistrāliem ir milzīgi. Mistral ir vērsts uz jebkuru lietošanas gadījumu, kas prasa precizitāti un strukturētu domu, sākot no finanšu modelēšanas un juridiskās analīzes līdz programmatūras arhitektūrai un datu inženierijai. Uzņēmums pat demonstrēja modeļa spēju ģenerēt viena šāviena fizikas simulāciju, parādot tā izpratni par sarežģītām sistēmām.

Wager tas nav viss bizness. Mistral arī iesaka modeli kā “radošu pavadoni” rakstīšanai un stāstu stāstīšanai, kas spēj ražot darbu, kas ir vai nu ļoti saskanīgs, vai, kā uzņēmums to saka, “apburoši ekscentrisks”.

Izmantojot miertiesu, Mistral AI veic stratēģisku spēli, lai ne tikai sacenstos, wager arī vadītu nākamajā AI robežā. Atjaunojot savu atvērtā koda bāzi ar jaudīgu, pieļaujami licencētu modeli, vienlaikus virzot aploksni uz uzņēmuma snieguma veiktspēju, uzņēmums signalizē, ka argumentācijas nākotne būs gan spēcīga, gan jēgpilna veidā visiem.


avots