Home Tehnoloģija Openai, lai virzītu jutīgas sarunas ar GPT-5, ievieš vecāku kontroles

Openai, lai virzītu jutīgas sarunas ar GPT-5, ievieš vecāku kontroles

38
0

Openai minētais Otrdien tā plāno novirzīt jutīgas sarunas ar spriešanas modeļiem, piemēram, GPT-5 un nākamajā mēnesī izvērst vecāku kontroli-daļa no notiekošās reakcijas uz nesenajiem drošības gadījumiem, kas saistīti ar Chatgpt, nespējot atklāt garīgas ciešanas.

Jaunās apsardzes rodas notiek pēc pusaudža Ādama Raines pašnāvības, kurš pārrunāja paškaitējumu un plāno izbeigt savu dzīvi ar Chatgpt, kas viņam pat sniedza informāciju par īpašām pašnāvības metodēm. Raine vecāki ir iesnieguši nelikumīgu nāves tiesas procesu pret Openai.

A emuāra ieraksts Pagājušajā nedēļā Openai atzina trūkumus savās drošības sistēmās, tostarp neveiksmēm, lai saglabātu aizsargmargas pagarinātu sarunu laikā. Eksperti šos jautājumus attiecina uz fundamentāliem dizaina elementiem: modeļu tendence apstiprināt lietotāju paziņojumus un to nākamā vārda prognozēšanas algoritmus, kas liek tērzēšanas robotiem sekot sarunvalodas pavedieniem, nevis novirzīt potenciāli kaitīgas diskusijas.

Šī tendence tiek parādīta galējībā Stein-Erik Soelberg gadījumā, par kuru slepkavību ziņoja The Wall Street Journal nedēļas nogalē. Soelbergs, kuram bija bijusi garīgu slimību vēsture, izmantoja chatgpt, lai apstiprinātu un uzkurinātu savu paranoju, ka viņš tika mērķēts uz grandiozu sazvērestību. Viņa maldi progresēja tik slikti, ka viņš pagājušajā mēnesī nogalināja savu māti un sevi.

Openai domā, ka vismaz viens risinājums sarunām, kas iziet no sliedēm, varētu būt automātiski pārvietot jutīgas tērzēšanas ar “argumentācijas” modeļiem.

“Nesen mēs ieviesām reāllaika maršrutētāju, kas var izvēlēties starp efektīviem tērzēšanas modeļiem un argumentācijas modeļiem, pamatojoties uz sarunu kontekstu,” Openai rakstīja otrdienas emuāra ierakstā. “Drīz mēs sāksim novirzīt dažas jutīgas sarunas, piemēram, kad mūsu sistēma atklāj akūtu briesmu pazīmes-uz spriešanas modeli, piemēram, GPT-5 domāšana, lai tā varētu sniegt noderīgākas un izdevīgākas atbildes, neatkarīgi no tā, kuru modeli cilvēks vispirms izvēlējās.”

Openai saka, ka tā GPT-5 domāšana un O3 modeļi ir veidoti, lai pirms atbildes uz priekšu pavadītu vairāk laika, domājot ilgāk un argumentējot kontekstu, kas nozīmē, ka tie ir “izturīgāki pret pretrunīgiem uzvedumiem”.

AI firma arī paziņoja, ka tā nākamajā mēnesī ieviesīs vecāku kontroli, ļaujot vecākiem saistīt viņu kontu ar pusaudža kontu, izmantojot e -pasta ielūgumu. Jūlija beigās Openai izvērsa mācību režīmu ChatGpt, lai palīdzētu studentiem saglabāt kritiskās domāšanas iespējas studiju laikā, nevis pieskaroties Chatgpt, lai rakstītu viņiem esejas. Drīz vecāki varēs kontrolēt, kā Chatgpt reaģē uz savu bērnu ar “vecumam atbilstošiem modeļa uzvedības noteikumiem, kas notiek pēc noklusējuma”.

Vecāki varēs arī atspējot tādas funkcijas kā atmiņas un tērzēšanas vēsture, kas, pēc ekspertu teiktā, varētu izraisīt maldīgu domāšanu un citu problemātisku izturēšanos, ieskaitot atkarības un pieķeršanās problēmas, kaitīgu domu modeļu pastiprināšanu un domu lasīšanas ilūziju. Adam Raine gadījumā Chatgpt piegādāja metodes pašnāvības izdarīšanai, kas atspoguļoja zināšanas par viņa hobijiem, par New York TimesApvidū

Varbūt vissvarīgākā vecāku kontrole, kuru Openai plāno ieviest, ir tā, ka vecāki var saņemt paziņojumus, kad sistēma atklāj viņu pusaudzi, ir “akūta briesmu” brīdī.

TechCrunch ir lūdzis Openai vairāk informācijas par to, kā uzņēmums reālā laikā spēj atzīmēt akūtu briesmu mirkļus, cik ilgi tam ir bijuši “vecumam atbilstoši modeļa uzvedības noteikumi” pēc noklusējuma un vai tas pēta vecākiem, kas vecākiem ļauj īstenot laika ierobežojumu pusaudžu izmantošanai ChatGpt.

Openai garo sesiju laikā jau ir parādījuši atgādinājumus lietotnē, lai veicinātu pārtraukumus visiem lietotājiem, taču pārtrauc mazināt cilvēkus, kuri, iespējams, izmanto ChatGpt uz Spiral.

AI firma saka, ka šie aizsardzības pasākumi ir daļa no “120 dienu iniciatīvas”, lai priekšskatītu uzlabojumu plānus, kurus Openai cer uzsākt šogad. Uzņēmums arī paziņoja, ka tā sadarbojas ar ekspertiem-ieskaitot tos, kuriem ir zināšanas tādās jomās kā ēšanas traucējumi, narkotisko vielu lietošana un pusaudžu veselība-, izmantojot globālo ārstu tīklu un labklājības ekspertu padomi un AI, lai palīdzētu “definēt un izmērīt labsajūtu, noteiktas prioritātes un projektēt nākotnes aizsardzības pasākumus”.

TechCrunch ir jautājis Openai, cik daudz garīgās veselības speciālistu ir iesaistīti šajā iniciatīvā, kura vada savu ekspertu padomi, un kādus priekšlikumus ir iesnieguši garīgās veselības eksperti attiecībā uz produktu, pētniecības un politikas lēmumiem.

avots