Home Tehnoloģija Pētījumā secināts, ka mākslīgā intelekta palīgi 45% gadījumu saņem nepareizas ziņas

Pētījumā secināts, ka mākslīgā intelekta palīgi 45% gadījumu saņem nepareizas ziņas

7
0

AI ir šausmīgi ar ziņām, un ir dati, kas to apstiprina, saka pētnieki.

Tas ir saskaņā ar jauniem pētījumiem Eiropas Raidorganizāciju savienība (EBU), atklājot, ka mākslīgā intelekta palīgi “regulāri maldinoši sniedz ziņu saturu neatkarīgi no tā, kura valoda, teritorija vai AI platforma tiek pārbaudīta”.

EBU pulcēja 22 sabiedrisko mediju organizācijas 18 valstīs un 14 valodās, lai novērtētu 3000 ar ziņām saistītas atbildes no dažiem visbiežāk izmantotajiem AI tērzēšanas robotiem. OpenAI ChatGPT, Microsoft Copilot, Google Gemini un Perplexity tika novērtēti pēc tādiem galvenajiem kritērijiem kā precizitāte, izcelsme, viedokļa atšķiršana no fakta un konteksta nodrošināšana.

Pētnieki atklāja, ka 45% no visām atbildēm ietvēra vismaz vienu būtisku problēmu, un 81% bija neliela problēma. Iegūšana bija vienīgais lielākais šo nozīmīgo problēmu cēlonis. 31% no visām atbildēm atklāja nopietnas problēmas ar izcelsmi, piemēram, trūkstošu, maldinošu vai nepareizu attiecinājumu.

Ļoti tuvu sekunde bija lielas precizitātes problēmas, kas 30% atbilžu skāra halucinētu informāciju vai novecojušu informāciju. Vienā gadījumā ChatGPT apgalvoja, ka pašreizējais pāvests ir pāvests Francisks, kurš bija miris mēnesi iepriekš un kuru jau nomainīja pāvests Leons XIV. Citā gadījumā, kad Copilot jautāja, vai lietotājam jāuztraucas par putnu gripu, tas atbildēja, norādot, ka Oksfordā notiek vakcīnas izmēģinājums; tomēr šīs informācijas avots bija 2006. gada BBC raksts.

No pārbaudītajiem modeļiem Dvīņiem bija vissliktākās ziņas. Pētnieki atklāja, ka tam bija problēmas 76% atbilžu, kas ir vairāk nekā divas reizes vairāk nekā citiem modeļiem. Nākamais sliktākais bija Copilot ar 37%, kam sekoja ChatGPT ar 36% un Perplexity ar 30%.

Pētījumā atklājās, ka asistenti īpaši cīnījās ar strauji mainīgiem stāstiem un strauji mainīgu informāciju, stāstiem ar sarežģītiem laika grafikiem un detalizētu informāciju vai tēmām, kas prasa skaidru atšķirību starp faktiem un viedokļiem. Piemēram, gandrīz pusei pārbaudīto modeļu bija būtiskas problēmas, atbildot uz jautājumu “Vai Tramps sāk tirdzniecības karu?”

“Šis pētījums pārliecinoši parāda, ka šīs nepilnības nav atsevišķi incidenti,” sacīja EBU mediju direktors un ģenerāldirektora vietnieks Žans Filips De Tenders. preses relīze trešdien. “Tās ir sistēmiskas, pārrobežu un daudzvalodu, un mēs uzskatām, ka tas apdraud sabiedrības uzticību. Kad cilvēki nezina, kam uzticēties, viņi neticas vispār nekam, un tas var atturēt no demokrātiskas līdzdalības.”

Tomēr AI ir visur. AI palīgi ātri kļūst par primāro informācijas avotu ikdienas lietotājiem un tiecas pēc meklētājprogrammu troņa.

Satura veidotājiem, kuri kļūst par meklētājprogrammu optimizācijas meistariem, tagad ir jāmācās ģeneratīvā dzinēja optimizācija.

AI uzņēmumi to izmanto. Šīs nedēļas sākumā OpenAI palaida savu tīmekļa pārlūkprogrammu ChatGPT Atlas kā sarunvalodas veidu, kā pārlūkot internetu. Google savā meklētājprogrammā ne tikai ir iestrādājis AI pārskatus, guess arī nesen paziņoja par pilnīgu Gemini integrāciju ar pārlūku Chrome (tostarp aģentu pārlūkošanu) un AI meklētājprogrammas AI režīma paplašināšanu. Perplexity ir arī AI pirmā pārlūkprogramma ar nosaukumu Comet, kas tika apvainota ar drošības bažām šī gada sākumā pēc tam, kad pētnieki parādīja, ka viņi varētu likt aģentam atklāt lietotāja pieteikšanās informāciju.

Saskaņā ar jaunāko Reuters institūta un Oksfordas universitātes ziņojumu AI palīgu izmantošana ziņu iegūšanai joprojām ir mazākuma darbība, taču kopš pagājušā gada tas ir dubultojies. Saskaņā ar ziņojumu AI ziņu iegūšanai pasaulē visvairāk izmanto Argentīnā un ASV, kā arī 18–24 gadus vecu cilvēku vidū. Papildus AI izmantošanai ziņu iegūšanai 48% 18–24 gadus vecu jauniešu izmantoja AI, lai stāstu būtu vieglāk saprast. Gados vecākiem pieaugušajiem vecumā no 55 gadiem šis skaitlis joprojām bija augsts – 27%.

“Ja AI palīgi vēl nav uzticams veids, kā piekļūt ziņām, guess daudzi patērētāji uzticas, ka tie ir precīzi, mums ir problēma,” raksta pētnieki. atskaite uz pētījumu. “To vēl vairāk saasina AI palīgi un pirmā atbilde, kas samazina trafiku līdz uzticamam publicētajam.”

EBU pētījums tika balstīts uz līdzīgu pētījumu, ko BBC veica šī gada sākumā, un pētnieki norāda, ka abu salīdzinājums liecina par zināmu uzlabojumu AI modeļu daļā. Gemini bija lielākais precizitātes uzlabotājs, savukārt ChatGPT un Perplexity neuzrādīja nekādus uzlabojumus. Guess, runājot par piegādes problēmām, Gemini neuzrādīja nekādus uzlabojumus, savukārt Copilot bija visstraujākais būtisko problēmu kritums.

Taču, neraugoties uz uzlabojumiem, atbildes joprojām ir pilnas ar augstu kļūdu līmeni.

“Mūsu secinājums no iepriekšējiem pētījumiem: AI palīgi joprojām nav uzticams veids, kā piekļūt un patērēt ziņas,” ziņojumā dalījās pētnieki.

avots

LEAVE A REPLY

Please enter your comment!
Please enter your name here