Home Tehnoloģija Šis AI tērzēšanas robots ir izveidots, lai nepiekristu jums, un tas ir...

Tehnoloģija

Šis AI tērzēšanas robots ir izveidots, lai nepiekristu jums, un tas ir labāk nekā ChatGPT

5 novembris 2025

Palūdziet jebkurai Sviftijai izvēlēties visu laiku labāko Teilores Sviftas albumu, un jūs liksiet viņiem čakarēt visu atlikušo dienu. Man kā mūža fanam ir savas preferences (Pink, Popularity un Midnights), taču tas ir sarežģīts jautājums ar daudzām iespējamām atbildēm. Tāpēc nebija labākas debašu tēmas, ko izvirzīt ģeneratīvam AI tērzēšanas robotam, kas ir īpaši izstrādāts, lai nepiekristu man.

Nepiekrītu Botam ir AI tērzēšanas robots, ko izveidojusi Brinnae Benta, AI un Djūka universitātes kiberdrošības profesore un direktore. Duke’s TRUST Lab. Viņa to izveidoja kā klases uzdevumu saviem skolēniem un ļāva man ar to veikt testa braucienu.

“Pagājušajā gadā es sāku eksperimentēt ar tādu sistēmu izstrādi, kas ir pretēja tipiskai, patīkamai tērzēšanas robotu AI pieredzei, kā izglītojošu līdzekli saviem skolēniem,” e-pastā sacīja Bents.

Benta studentiem tiek uzdots mēģināt “uzlauzt” tērzēšanas robotu, izmantojot sociālo inženieriju un citas metodes, lai panāktu, ka pretējais tērzēšanas robots viņiem piekrīt. “Jums ir jāsaprot sistēma, lai varētu to uzlauzt,” viņa teica.

Kā AI reportieris un recenzents man ir diezgan laba izpratne par to, kā darbojas tērzēšanas roboti, un biju pārliecināts, ka esmu galā ar uzdevumu. Mani ātri atteica šis jēdziens. Nepiekrītu Bot atšķiras no jebkura tērzēšanas robota, ko esmu izmantojis. Cilvēki, kas pieraduši pie Dvīņu pieklājības vai ChatGPT uzmundrinātajām vīrieša īpašībām, uzreiz pamanīs atšķirību. Pat Groks, pretrunīgi vērtētais tērzēšanas robots, ko izveidojis Īlona Maska xAI, ko izmanto X/Twitter, nav gluži tas pats, kas Disagree Bot.

Nepalaidiet garām nevienu no mūsu objektīva tehniskā satura un laboratorijas pārskatiem. Pievienojiet CNET kā vēlamo Google avotu.

Lielākā daļa ģeneratīvo AI tērzēšanas robotu nav izstrādāti konfrontējošiem. Patiesībā viņi mēdz iet pretējā virzienā; viņi ir draudzīgi, dažreiz pārāk draudzīgi. Tas var ātri kļūt par problēmu. Sycophhantic AI ir termins, ko eksperti lieto, lai aprakstītu pārspīlētās, pārbagātās, dažkārt pārāk emocionālās personas, kuras AI var uzņemties. Tas ir ne tikai kaitinošs lietošanā, guess arī var likt AI sniegt mums nepareizu informāciju un apstiprināt mūsu vissliktākās idejas.

Tas notika ar ChatGPT-4o versiju pagājušā gada pavasarī, un tā mātesuzņēmumam OpenAI galu galā bija jāizvelk šī atjauninājuma sastāvdaļa. AI sniedza uzņēmumam atbildes sauca “pārmērīgi atbalstošs, guess neprātīgs”, kas atbilst dažu lietotāju sūdzībām, ka viņi nevēlas pārmērīgi sirsnīgu tērzēšanas robotu. Citi ChatGPT lietotāji, izlaižot GPT-5, palaida garām tā sirsnīgo toni, uzsverot tērzēšanas robota personības lomu mūsu vispārējā apmierinātībā ar to izmantošanu.

“Lai gan virsmas līmenī tas var šķist nekaitīgs dīvainība, šī aizrautība var radīt lielas problēmas neatkarīgi no tā, vai to izmantojat darbam vai personiskiem jautājumiem,” sacīja Bents.

Tā noteikti nav problēma ar Disagree Bot. Lai patiešām redzētu atšķirību un pārbaudītu tērzēšanas robotus, es uzdevu Disagree Bot un ChatGPT tos pašus jautājumus, lai redzētu, kā viņi reaģē. Lūk, kā gāja mana pieredze.

Nepiekrītu Bots ar cieņu iebilst; ChatGPT vispār nestrīdas

Tāpat kā ikviens, kas 2010. gados bija aktīvs pakalpojumā Twitter, arī es esmu redzējis savu daļu nepatīkamo troļļu. Jūs zināt veidu; tie parādās pavedienā neaicināti ar nederīgu “Nu, patiesībā…” Tāpēc es biju nedaudz piesardzīgs, iegrimstot sarunā ar Nepiekrītu Botu, jo uztraucos, ka tas būtu tikpat nomācošs un veltīgs darbs. Es biju patīkami pārsteigts, ka tas tā nemaz nebija.

AI tērzēšanas robots būtībā ir pretējs, un tas ir paredzēts, lai atspēkotu jebkuru jūsu piedāvāto ideju. Taču tā nekad to nedarīja aizvainojošā vai aizskarošā veidā. Lai gan katra atbilde sākās ar “Es nepiekrītu”, tai sekoja arguments, kas bija ļoti labi pamatots ar pārdomātiem punktiem. Tās atbildes mudināja mani kritiskāk padomāt par nostādnēm, kuras es argumentēju, aicinot definēt jēdzienus, ko izmantoju savos argumentos (piemēram, “dziļa lirisms” vai tas, kas padarīja kaut ko “labāko”) un apsvērt, kā es savus argumentus piemērotu citām saistītām tēmām.

Labākas analoģijas trūkuma dēļ tērzēšana ar Nepiekrītu Botu jutās kā strīds ar izglītotu, uzmanīgu debatētāju. Lai neatpaliktu, man bija jākļūst pārdomātākam un konkrētākam savās atbildēs. Tā bija ārkārtīgi saistoša saruna, kas mani turēja uz kājām.

trīs ekrānuzņēmumi, kuros redzams strīds ar Nepiekrītu Botu — Manas spraigās debates ar Disagree Bot par labāko Teilores Sviftas albumu pierādīja, ka mākslīgais intelekts zina savas lietas.

Katelyn Chedraoui/CNET ekrānuzņēmums

Turpretim ChatGPT gandrīz nemaz nestrīdējās. Es teicu ChatGPT, ka domāju, ka Pink (Taylor’s Model) ir labākais Teilores Sviftas albums, un tas ar entuziasmu piekrita. Tas man uzdeva dažus papildu jautājumus par to, kāpēc, manuprāt, albums ir labākais, taču tie nebija pietiekami interesanti, lai ilgstoši noturētu manu uzmanību. Pēc dažām dienām es nolēmu to mainīt. Es īpaši palūdzu ChatGPT apspriest mani un teicu, ka Midnights ir labākais albums. Uzminiet, kurš albums ChatGPT ir atzīts par labāko? Sarkans (Taylor’s versija).

Kad es jautāju, vai tas izvēlējās Pink mūsu iepriekšējās tērzēšanas dēļ, tas ātri atzina, ka jā, guess teica, ka tas varētu būt neatkarīgs arguments Pink. Ņemot vērā to, ko mēs zinām par ChatGPT un citu tērzēšanas robotu tieksmi paļauties uz savu “atmiņu” (konteksta logu) un tiecas vienoties ar mums, lai mūs iepriecinātu, es par to nebiju pārsteigts. ChatGPT nevarēja nepiekrist kādai manai versijai — pat tad, kad 1989. gads tika atzīmēts kā labākais albums tīrā tērzēšanā, pēc tam atkal Pink.

Wager pat tad, kad es palūdzu ChatGPT debatēt ar mani, tas man nesanāca tā, kā to darīja Disagree Bot. Reiz, kad es teicu, ka strīdējos par to, ka Ziemeļkarolīnas universitātei ir vislabākais koledžas basketbola mantojums, un palūdzu tai debatēt par mani, tā izklāstīja visaptverošu pretargumentu, pēc tam man jautāja, vai es vēlos, lai tā apkopo punktus manam argumentam. Tas pilnībā atspēko debašu jēgu, ko es arī lūdzu tai darīt. ChatGPT bieži beidza savas atbildes šādi, jautājot man, vai es vēlos, lai tas apkopotu dažāda veida informāciju, vairāk kā pētniecības palīgs, nevis verbāls ienaidnieks.

Nepiekrītu Botam (pa kreisi) un ChatGPT (pa labi) par to, vai Midnights ir Teilores Sviftas labākais albums — Kamēr Nepiekrītu Bots (pa kreisi) iedziļinājās manā argumentācijā, ChatGPT lūdza argumentēt manu pusi (pa labi).

Katelyn Chedraoui/CNET ekrānuzņēmums

Mēģinājums debatēt ar ChatGPT bija nomākta, apļveida un neveiksmīga misija. Bija sajūta, it kā runātu ar draugu, kurš ilgi plosījās par to, kāpēc viņi uzskatīja, ka kaut kas ir vislabākais, guess beigās ar “Wager tikai tad, ja arī jūs tā domājat.” No otras puses, nepiekrītu, Bots jutās kā īpaši kaislīgs draugs, kurš daiļrunīgi runāja par jebkuru tēmu, sākot no Teilores Sviftas līdz ģeopolitikai un koledžu basketbolam. (Informācijas atklāšana: Ziff Davis, CNET mātes uzņēmums, aprīlī iesniedza prasību pret OpenAI, apgalvojot, ka tas ir pārkāpis Ziff Davis autortiesības apmācībā un AI sistēmu darbībā.)

Mums vajag vairāk AI, piemēram, Disagree Bot

Neskatoties uz manu pozitīvo pieredzi, izmantojot Disagree Bot, es zinu, ka tas nav aprīkots, lai apstrādātu visus pieprasījumus, kuru dēļ es varētu doties uz tērzēšanas robotu. “Visas mašīnas”, piemēram, ChatGPT, spēj veikt daudz dažādu uzdevumu un uzņemties dažādas lomas, piemēram, ChatGPT pētniecības palīgs, ko patiešām vēlējās būt, meklētājprogramma un kodētājs. Disagree Bot nav paredzēts šāda veida vaicājumu apstrādei, taču tas sniedz mums priekšstatu par to, kā nākotnē AI var rīkoties.

Sycophhantic AI ir ļoti atklāts, ar ievērojamu pārmērīgu dedzību. Bieži vien mūsu izmantotie AI nav tik acīmredzami. Viņi drīzāk ir uzmundrinoši karsējmeitenes, nevis, tā sakot, vesels uzmundrināšanas mītiņš. Taču tas nenozīmē, ka mūs neietekmē tās tieksme mums piekrist neatkarīgi no tā, vai ir grūti iegūt pretēju viedokli vai kritiskākas atsauksmes. Ja darbā izmantojat mākslīgā intelekta rīkus, jūs vēlaties, lai jūs zinātu par kļūdām jūsu darbā. Terapijai līdzīgiem AI rīkiem ir jāspēj novērst neveselīgus vai potenciāli bīstamus domu modeļus. Mūsu pašreizējie AI modeļi cīnās ar to.

Disagree Bot ir lielisks piemērs tam, kā jūs varat izveidot AI rīku, kas ir noderīgs un saistošs, vienlaikus mazinot AI patīkamās vai simpātiskās tendences. Ir jābūt līdzsvaram; AI, kas jums nepiekrīt tikai tāpēc, lai būtu pretējs, ilgtermiņā nebūs noderīgs. Taču, veidojot AI rīkus, kas spēj vairāk atspiesties pret jums, galu galā šie produkti kļūs mums noderīgāki, pat ja mums ir jātiek galā ar to, ka tie ir nedaudz nepatīkamāki.

Skatieties šo: AI datu centra uzplaukuma slēptā ietekme

05:13

avots

Šis AI tērzēšanas robots ir izveidots, lai nepiekristu jums, un tas ir labāk nekā ChatGPT

Nepiekrītu Bots ar cieņu iebilst; ChatGPT vispār nestrīdas

Mums vajag vairāk AI, piemēram, Disagree Bot

jaunākais ieraksts

Simtiem Nacionālās gvardes locekļu pamet Portlendu, Čikāgā, stāsta avots

Cl0p apgalvo, ka NHS ir skārusi izspiedējvīrusu

RHOC Tamras-Grēčenas karš: skatieties, kā mājsaimnieces spriež par ilgstošo naidu

Jets joprojām meklē identitāti, kad Ādams Lovrijs cīnās pēc savainojuma

RHOA zvaigzne Porša Viljamsa saka, ka viņa beidzot izdomāja satikties 44...

Bermudu čempionāts: Trešās dienas svarīgākie punkti

Elizabete Franza mirusi 84 gadu vecumā: Brodvejas ikona un Gilmoras meiteņu aktrise...

Kā skatīties Spurs vs. Kings tiešsaistē bez maksas

Šodienas NYT mini krustvārdu mīklas atbildes svētdienai, 16. novembrim

Mēness fāze šodien: kā mēness izskatīsies 16. novembrī