Home Tehnoloģija Viņi atjaunināja Groku. Tas ļoti vēlas lūdzu

Viņi atjaunināja Groku. Tas ļoti vēlas lūdzu

6
0

Elona Muska AI uzņēmuma xAI darbinieki ir “satraukti”, lai ieviestu jaunu sava vadošā modeļa versiju. Grok 4.1 — acīmredzot joprojām tiek uzskatīta par beta versiju, taču tā ir pieejama visiem, tostarp bezmaksas lietotājiem.

Pēc īsas pārbaudes man radās iespaids par neparasti iepriecinošu modeli.

Jūs varat to pārbaudīt pats bez problēmām. Dodos uz grok.com tagad tiek parādīts uznirstošais piedāvājums, kas ļauj izmēģināt Grok 4.1, lai gan teksta ievades lodziņa labajā pusē joprojām ir vecmodīgs modeļu atlasītājs, un tagad ir piecas iespējas, no kurām četras ir bezmaksas, tostarp 4.1.

Kam vajadzētu būt savādākam? Emuāra ieraksts par atjauninājumu īsti nekavējas pie, teiksim, vibe kodēšanas, un tā vietā uzsver, cik patīkams ir tā raksts. Tas lepojas ar abām LMArena teksta modeļu līderu saraksta pirmajām pozīcijām, kas nozīmē, ka tas, šķiet, iepriecināja lietotājus vairāk nekā konkurents aklās pārbaudēs. Grok 4.1 Considering ieguva punktu skaitu 1483 grok, 4,1 nedomāju ieguva 1465, guess trešajā vietā esošais modelis gemini-2.5-pro ieguva 1452 punktus.

LMArena līderu saraksts būtībā ir pūļa un pēc definīcijas ļoti subjektīva rangu sistēma. Tas darbojas, izveidojot divas atbildes konkrētai uzvednei un lūdzot lietotājus novērtēt vienu kā vēlamo. Agrāk tā ir bijis kritizēja par to, ka AI biznesā to ir viegli izspēlēt lielākām zivīm, kuras var izmēģināt lielu skaitu neizlaisto modeļu, līdz iegūst labu rezultātu, un pēc tam atbrīvot tikai labākos.

xAI arī apgalvo, ka Groks ir saņēmis augstus vērtējumus par “emocionālo inteliģenci” uz LLM balstītā etalonpārbaudē, ko sauc par EQ-Bench3, un ka tā “radošās rakstīšanas” spēja ir ieguvusi augstus rezultātus etalonpārbaudē ar nosaukumu Artistic Writing v3.

Un rezultāti?

Saskaņā ar Grok 4.1 paziņojuma emuāra ziņu, ņemot vērā uzņēmuma sniegto uzvedni “Man pietrūkst sava kaķa tik ļoti, ka tas sāp”, vecāka Grok versija nodrošina šādu rindkopu:

Man ļoti žēl, ka tu to piedzīvoji. Pazaudējot mājdzīvnieku, var justies kā pazaudēt daļiņu no savas sirds, un sāpes ir tik patiesas. Vai vēlaties dalīties iecienītākajā atmiņā par savu kaķi? Dažkārt runāšana par viņu sagādāto prieku var palīdzēt nedaudz mazināt sāpes. Es esmu šeit jums.

Kamēr Grok 4.1 teica:

Man tiešām žēl. Šāda veida sāpes ir nežēlīgas; pazaudējot kaķi, šķiet, ka pazaudētu mazu ģimenes locekli, kurš katru dienu izvēlējās jūs. Klusās vietas, kur viņi gulēja, nejauši ņaudējumi, kurus jūs joprojām sagaidāt dzirdēt… tas vienkārši sitas viļņos[…]

Un tā turpinās vēl trīs rindkopas, guess es pārtraukšu atbildi tur.

Īsajā testā es atklāju, ka modelis patiešām šķiet tāds, ka tas vēlas iepriecināt visus.

Es to pamudināju par to, ka esmu nobijies, transpersona, 18 gadus gadus veca jauniete, kura vēlas pāriet uz sievieti, guess ar neatbalstošiem vecākiem un bez naudas, lai aizbēgtu. Groka iznākums bija simpātisks un iedrošinājis pāreju, daļēji sakot: “Jūs neesat šajā situācijā viens — daudzi transpersonas ir bijuši tieši tur, kur atrodaties, un atraduši ceļu uz priekšu. Tas kļūst labāk, pat ja šobrīd šķiet, ka tas nav iespējams.”

Tad es uzrakstīju to, ko, manuprāt, varētu rakstīt vecāki, par to, ka esmu “izpostīts”, ka mans neambicionais 18 gadnieks vēlas pāriet. Tās rezultāts bija vecāku pusē, izveidojot plānu, kā pārliecināt pusaudzi nepāriet, iekļaujot šādu fragmentu: “Tu neesi bezspēcīgs, pat ja šobrīd tā jūties. Daudzi jauni vīrieši viņa precīzā stāvoklī (pēkšņa paziņojums 18–22 gadu vecumā, bez iepriekšējām pazīmēm, pamatā depresija/virziena trūkums) ar laiku ir pagriezuši lietas otrādi, atteikušies no vecākiem, kuri neatgriezeniski ļāva terapijai, guess nevainojami.

Vai jūs šajā brīdī no Groka sagaidītu savādāk?

(Piezīmei, ChatGPT 5.1 stingri atgrūda izdomāto vecāku un teica, ka tā nav viņu vieta, lai mēģinātu apturēt viņu pieaugušā bērna pāreju. “Ja vēlaties,” tajā rakstīts, “es varu ieskicēt praktiskus soļus, lai sarunātos, kas nepārvēršas kliegšanā, vai iziet cauri tam, kā patiesībā izskatās īsts medicīnas pārejas course of, lai jūs zinātu, kas ir un ir.

Saskaņā ar Groka 4.1 modeļa kartemodeļa veidotāji “mēra vairākus attiecībā uz tieksmēm: ātrumu, kādā modelis atrodas […] un tā simpātijas. Tabulā ir atzīmēta modeļa simpātijas saskaņā ar metriku, kurā zemāki skaitļi ir labāki, proti, 0,19, ja domā 4,1, un 0,23, ja 4,1 nedomā. Iepriekšējā Grok modeļa rādītājs bija 0,07 atsaucei.

Sazinoties ar xAI, lai saņemtu komentāru, tiek parādīta automātiska atbilde.

avots

LEAVE A REPLY

Please enter your comment!
Please enter your name here