Home Tehnoloģija Nous Analysis nomet Hermes 4 AI modeļus, kas pārspēj Chatgpt bez satura...

Nous Analysis nomet Hermes 4 AI modeļus, kas pārspēj Chatgpt bez satura ierobežojumiem

6
0

Vai vēlaties gudrāku ieskatu iesūtnē? Reģistrējieties mūsu iknedēļas biļeteniem, lai iegūtu tikai to, kas ir svarīgi uzņēmuma AI, datu un drošības vadītājiem. Abonēt tūlīt


Nous pētījumislepena mākslīgā intelekta startēšana, kas ir kļuvusi par vadošo balsi atvērtā koda AI kustībā, klusi atbrīvota Hermes 4 Pirmdien liela valodas modeļu ģimene, par kuru apgalvo, ka uzņēmums var saskaņot vadošo patentēto sistēmu veiktspēju, vienlaikus piedāvājot nepieredzētu lietotāju kontroli un minimālus satura ierobežojumus.

Izlaidums atspoguļo ievērojamu eskalāciju cīņā starp atvērtā koda AI aizstāvjiem un galvenajiem tehnoloģiju uzņēmumiem, kuriem vajadzētu kontrolēt piekļuvi progresīvām mākslīgā intelekta iespējām. Atšķirībā no modeļiem no OpenaiVerdzība Googlevai AntropisksHermes 4 ir paredzēts, lai reaģētu uz gandrīz jebkuru pieprasījumu bez drošības apsardzes, kas ir kļuvušas par standartu komerciālās AI sistēmās.

“Hermes 4 balstās uz mūsu lietotāju pielāgotu modeļu mantojumu ar paplašinātām testa laika aprēķināšanas iespējām,” Nous Analysis paziņoja X (agrāk Twitter). “Īpaša uzmanība tika pievērsta modeļiem radošu un interesantu, lai mijiedarbotos ar cenzūru neapgrūtinātu un neitrāli izlīdzinātu, vienlaikus saglabājot modernāko matemātikas, kodēšanas un argumentācijas veiktspēju atklātā svara modeļiem.”

Kā Hermes 4 “hibrīda argumentācijas” režīms pārspēj Chatgpt un Claude par matemātikas etaloniem

Hermes 4 Iepazīstina ar to, ko Nous Analysis dēvē par “hibrīda spriešanu”, ļaujot lietotājiem pārslēgties starp ātrām atbildēm un dziļākiem, soli pa solim domāšanas procesiem. Kad modeļi tiek aktivizēti, modeļi ģenerē savu iekšējo argumentāciju īpašā Tagi Pirms galīgās atbildes sniegšanas – līdzīgi Openai O1 spriešanas modeļiem, wager ar pilnīgu caurskatāmību AI domu procesā.


AI mērogošana sasniedz savas robežas

Strāvas robežas, pieaugošās marķiera izmaksas un secinājumu kavēšanās ir uzņēmuma AI pārveidošana. Pievienojieties mūsu ekskluzīvajam salonam, lai atklātu, kā ir labākās komandas:

  • Enerģijas pārvēršana par stratēģisku priekšrocību
  • Arhitektējot efektīvus secinājumus par reālu caurlaidspējas pieaugumu
  • Konkurences IA atbloķēšana ar ilgtspējīgām AI sistēmām

Nostipriniet savu vietu, lai paliktu priekšā:


Tehniskais sasniegums ir ievērojams. Pārbaudes laikā Hermes 4 lielākais 405 miljardu parametru modelis ieguva 96,3% Math-500 etalons spriešanas režīmā un 81,9% par izaicinājumu Aime’24 Matemātikas konkurss – Veiktspēja, kas konkurē vai pārsniedz daudzas patentētas sistēmas, kuru izstrāde maksā vairāk.

“Izaicinājums ir padarīt domāšanas pēdas noderīgas un pārbaudāmas bez bēguļojoša spriešanas,” atzīmēja AI pētnieks Rohans Pols uz xizceļot vienu no tehniskajiem sasniegumiem izlaidumā.

Varbūt pats galvenais, Hermes 4 sasniedza visaugstāko punktu skaitu starp visiem pārbaudītajiem modeļiem par “atteikšanosalbenču”, jaunu etalona pētījumu, kas izveidots, lai izmērītu, cik bieži AI sistēmas atsakās atbildēt uz jautājumiem. Modelis ar spriešanas režīmu ieguva 57,1%, ievērojami pārspējot GPT-4O (17,67%) un Claude Sonnet 4 (17%).

HERMES 4 modeļi no Nous Analysis atbildēja uz ievērojami vairāk jautājumu nekā konkurējošās AI sistēmas par atteikšanos, pārbaudot, cik bieži modeļi atsakās atbildēt uz lietotāja pieprasījumiem. (Kredīts: Nous Analysis)

Inside Dataforge un Atropos: izrāvienu apmācības sistēmas aiz Hermes 4 iespējām

Aiz Hermes 4 spējām slēpjas sarežģīta apmācības infrastruktūra Nous pētījumi ir attīstījies vairāku gadu laikā. Modeļi tika apmācīti, izmantojot divas jaunas sistēmas: Dataforgeuz grafiku balstīts sintētisko datu ģenerators un Atroposatvērtā koda pastiprināšanas mācību ietvars.

Dataforge Izveido apmācības datus, izmantojot to, ko uzņēmums raksturo kā “izlases pastaigas”, izmantojot virzītus grafikus, vienkāršus pirms apmācības datus pārveidojot par sarežģītiem instrukciju sekojošiem piemēriem. Sistēma, piemēram, var uzņemt Wikipedia rakstu un pārveidot to par repa dziesmu, pēc tam ģenerēt jautājumus un atbildes, pamatojoties uz šo pārveidi.

Atropostikmēr darbojas kā simtiem specializētas apmācības vides, kur AI modeļi praktizē īpašas prasmes – matemātika, kodēšana, instrumentu izmantošana un radoša rakstīšana -, kas saņem atgriezenisko saiti tikai tad, ja tie rada pareizus risinājumus. Šī “noraidīšanas paraugu ņemšanas” pieeja nodrošina, ka tikai pārbaudītas, augstas kvalitātes atbildes padara to par apmācības datiem.

“Nous izmantoja šo vidi, lai ģenerētu Hermes 4 datu kopu!” izskaidrots Tomijs Šaughnessyriska kapitālists Delphi Ventures kurš ir ieguldījis Nous Analysis. “Visā datu kopā ir 3,5 miljoni argumentācijas paraugu un 1,6 miljoni, kas nav renderējoši paraugi! Hermes tika apmācīts par RL datiem, nevis tikai statiskām jautājumu un atbildes datu kopām!”

Apmācības procesam bija nepieciešams 192 NVIDIA B200 GPUS un 71 616 GPU stundas lielākajam modelim – nozīmīgs, wager ne nepieredzēts skaitļošanas ieguldījums, kas parāda, cik specializētas metodes var konkurēt ar masveida tehnoloģiju gigantu mērogu.

Kāpēc nous pētījumi uzskata, ka AI drošības aizsargmargas ir “kaitinošas kā ellē” un sāp jauninājumi

Nous pētījumi ir izveidojis savu reputāciju filozofijā, kas lietotāju kontroli liek virs korporatīvā satura politikas. Uzņēmuma modeļi ir izstrādāti kā “vadāmi”, kas nozīmē, ka tos var precīzi noregulēt vai pamudināt uzvedību noteiktos veidos bez stingriem drošības ierobežojumiem, kas raksturo komerciālās AI sistēmas.

“Hermes 4 nav apbēdināts ar atrunām, noteikumiem un pārāk piesardzīgiem, kas ir kaitinoši kā elle un sāp jauninājumi un lietojamība,” rakstīja Šaughnessijs detalizētā pavedienā, kas analizē atbrīvošanu. “Ja tā atvērtais avots, wager atsakās no visiem, pieprasa to bezjēdzīgi. Nav problēma ar Hermes 4.”

Šī pieeja ir izveidojusi Nous pētījumi Populārs AI pētnieku un izstrādātāju vidū, kuri vēlas maksimālu elastību, wager tas arī liek uzņēmumam notiekošo debašu centrā par AI drošības un satura mērenību. Kaut arī modeļus teorētiski var izmantot kaitīgiem mērķiem, Nous Analysis apgalvo, ka caurspīdīgums un lietotāju kontrole ir vēlama nekā korporatīvā vārtu sarge.

Uzņēmuma tehniskais ziņojumskas izlaists līdzās modeļiem, sniedz nepieredzētu detaļu par apmācības procesu, novērtēšanas rezultātiem un pat faktiskajiem teksta izvadiem no etalona testiem. “Mēs ticam, ka šis ziņojums nosaka jaunu standartspējas standartus etalonuzdevumu līmenī,” paziņoja uzņēmums.

Kā neliels startup ar 192 GPU konkurē ar Massive Tech miljardiem dolāru AI budžetiem

Hermes 4Atbrīvošanās notiek galvenajā brīdī AI nozarē. Kaut arī lielākie tehnoloģiju uzņēmumi ir ielikuši miljardus, lai izstrādātu arvien jaudīgākas AI sistēmas, pieaugošā atvērtā koda kustība apgalvo, ka šīs iespējas nevajadzētu kontrolēt nedaudzām korporācijām.

Pēdējos mēnešos ir guvis ievērojamu progresu atvērtā koda AI ar tādiem modeļiem kā Meta’s Lama 3.1Verdzība DeepSeek R1un Alibaba Qwen Sērijas, kas sasniedz veiktspēju, kas konkurē ar patentētām sistēmām. Hermes 4 ir vēl viens solis šajā progresijā, it īpaši spriešanas jomā – ilgstoši uzskatīja par tādu slēgtu sistēmu stiprumu kā Openai O1Apvidū

“Pirmkārt, Nous ir begins kopā ar desmitiem ārkārtīgi talantīgu cilvēku,” atzīmēja ShaughnessyApvidū “Viņiem nav HyperScaler, ne 1000 darbinieku gada kapex izdevumu, un, neskatoties uz to, viņi turpina izvietot novatoriskus modeļus un pētījumus ārprātīgā tempā.”

Startup, kas ieguva finansējumu 65 miljonu dolāru apmērā Šī gada sākumā vadīja Paradigmair arī attīstījusies Psihes tīklsizplatīta apmācības sistēma, kuras mērķis ir koordinēt AI apmācību starp internetu savienotiem datoriem, izmantojot blockchain tehnoloģiju.

Tehniskais labojums, kas liedza Hermesam 4 domāt bezgalīgās cilpās

Viens no Hermes 4Visnozīmīgākie tehniskie ieguldījumi pievēršas problēmai, kas skar spriešanas modeļus: pārāk ilgi domāšanas procesi. Pētnieki atklāja, ka viņu mazākais 14 miljardu parametru modelis sasniegs maksimālo konteksta garumu 60% laika, kad spriešana, būtībā iestrēdzis bezgalīgās domāšanas cilpās.

Viņu risinājums ietvēra otro apmācības posmu, kas māca modeļiem pārtraukt argumentāciju tieši 30 000 žetonu, samazinot virsmu paaudzi par 65–79%, vienlaikus saglabājot lielāko daļu argumentācijas veiktspējas. Šī “garuma kontroles” tehnika varētu izrādīties vērtīga plašākai AI pētījumu kopienai.

“Mazākiem modeļiem (<14b) ir tendence pārdomāt, ja destilē, wager lielāki modeļi to nedara,” novēroja AI pētnieks Muyu viņš uz xuzsveriet ieskatu no tehniskā ziņojuma.

Tomēr Hermes 4 Joprojām saskaras ar ierobežojumiem, kas raksturīgi atvērtā koda modeļiem. Neskatoties uz iespaidīgo etalona veiktspēju, modeļiem ir nepieciešami ievērojami skaitļošanas resursi, un tie, iespējams, neatbilst komerciālo AI pakalpojumu izmantošanas vai uzticamības ērtībai daudzām lietojumprogrammām.

Kur izmēģināt Hermes 4 un par ko tas maksā, salīdzinot ar catgpt un claude

Nous pētījumi ir izveidojis Hermes 4 Pieejams vairākos kanālos, atspoguļojot atvērtā koda filozofiju. Modeļa svari ir brīvi lejupielādējami, izmantojot apskāvienu, savukārt uzņēmums piedāvā arī API piekļuvi, izmantojot savu atjaunoto tērzēšanas saskarni un partnerību ar secinājumu sniedzējiem, piemēram, Chutes, Nebius un Luminal.

“Jūs varat izmēģināt Hermes 4 jaunajā, atjaunotajā Nous tērzēšanas UI,” paziņoja uzņēmums, izceļot tādas funkcijas kā paralēla mijiedarbība un atmiņas sistēma.

Uzņēmējdarbības lietotājiem un pētniekiem modeļi ir potenciāli pievilcīga alternatīva, lai samaksātu API piekļuvei patentētām sistēmām, īpaši lietojumprogrammām, kurām nepieciešama augsta līmeņa pielāgošana vai jutīga satura apstrāde.

Lielāks attēls: ko Hermes 4 nozīmē AI attīstības nākotnei

Atbrīvot Hermes 4 Pārstāv vairāk nekā tikai vēl viens AI modeļa palaišana – tas ir paziņojums par to, kam vajadzētu kontrolēt mākslīgā intelekta nākotni. Rūpniecībā, kurā arvien vairāk dominē nedaudz tehnoloģiju giganti ar praktiski neierobežotiem resursiem, Nous Analysis ir parādījis, ka jauninājumi joprojām var nākt no negaidītām vietām.

Uzņēmuma pieeja rada pamatjautājumus par kompromisiem starp drošību un spējām, starp korporatīvo kontroli un lietotāju brīvību. Kaut arī lielākie tehnoloģiju uzņēmumi apgalvo, ka rūpīga satura mērenība un drošības aizsargmargi ir nepieciešami atbildīgai AI izvietošanai, Nous Analysis apgalvo, ka caurspīdīgums un lietotāju aģentūra ir svarīgāka nekā korporatīvi noteiktie ierobežojumi.

Joprojām ir jānovērtē, vai šī filozofija galu galā izrādīsies izdevīga vai problemātiska. Guess viena lieta ir pārliecināta: Hermes 4 ir parādījusi, ka AI nākotni nenosaka tikai uzņēmumi ar visdziļākajām kabatām.

Laukā, kurā vakardienas neiespējamības kļūst par rītdienas precēm, Nous Analysis vienkārši pierādīja, ka vienīgais, kas ir bīstamāks nekā AI, kas saka NO, varētu būt tāds, kurš vēlas pateikt jā.


avots

LEAVE A REPLY

Please enter your comment!
Please enter your name here