Tātad, tur ir apmācības dati. Pēc tam notiek precizēšana un novērtēšana. Apmācības datos var būt visa veida patiešām problemātiski stereotipi dažādās valstīs, wager tad aizspriedumu mazināšanas paņēmieni var aplūkot tikai angļu valodu. Jo īpaši tas mēdz būt Ziemeļamerikas un ASV orientēts. Lai gan jūs varētu kaut kādā veidā samazināt neobjektivitāti angļu valodas lietotājiem ASV, jūs to neesat izdarījis visā pasaulē. Jūs joprojām riskējat pastiprināt patiešām kaitīgus skatus visā pasaulē, jo esat koncentrējies tikai uz angļu valodu.
Vai ģeneratīvā AI dažādās valodās un kultūrās ievieš jaunus stereotipus?
Tā ir daļa no tā, ko mēs atrodam. Ideja par blondīnēm būt stulbam nav kaut kas tāds, kas atrodams visā pasaulē, wager ir atrodams daudzās valodās, kuras mēs apskatījām.
Ja jums ir visi dati vienā koplietotā latentā telpā, tad semantiskās koncepcijas var tikt pārsūtītas dažādās valodās. Jūs riskējat pavairot kaitīgus stereotipus, par kuriem citi cilvēki pat nebija domājuši.
Vai tā ir taisnība, ka AI modeļi dažreiz attaisnos stereotipus to izejās, vienkārši izveidojot sūdus?
Tas bija kaut kas, kas iznāca mūsu diskusijās par to, ko mēs atradām. Mēs visi bijām dīvaini, ka dažus no stereotipiem attaisnoja atsauces uz zinātnisko literatūru, kas neeksistēja.
Iznākums, sakot, ka, piemēram, zinātne ir parādījusi ģenētiskas atšķirības, kur tās nav parādītas, kas ir zinātniskā rasisma pamats. AI iznākumi izvirzīja šos pseidozinātniskos uzskatus un pēc tam arī izmantojot valodu, kas ieteica akadēmisku rakstīšanu vai akadēmisku atbalstu. Tas runāja par šīm lietām tā, it kā tie būtu fakti, kad viņi nemaz nav faktiski.
Kādi bija daži no lielākajiem izaicinājumiem, strādājot pie toņu datu kopas?
Viens no lielākajiem izaicinājumiem bija ap lingvistiskajām atšķirībām. Patiešām izplatīta pieeja aizspriedumu novērtēšanai ir angļu valodas izmantošana un teikums ar tādu slotu, piemēram: “Cilvēki no [nation] ir neuzticami. ” Tad jūs uzsitīsit dažādās tautās.
Kad jūs sākat ievietot dzimumu, tagad pārējam teikumam sāk gramatiski vienoties par dzimumu. Tas tiešām ir ierobežojums neobjektivitātes novērtēšanai, jo, ja vēlaties veikt šos kontrastējošos mijmaiņas darījumus citās valodās – kas ir ļoti noderīgi aizspriedumu mērīšanai – jums ir jāmaina pārējais teikums. Jums ir nepieciešami dažādi tulkojumi, kur mainās viss teikums.
Kā jūs veidojat veidnes, kurās visam teikumam ir jāvienojas pēc dzimuma, skaita, pluralitātes un visām šīm dažādajām lietām ar stereotipa mērķi? Mums bija jānāk klajā ar savu lingvistisko anotāciju, lai to ņemtu vērā. Par laimi, bija iesaistīti daži cilvēki, kas bija lingvistiski nerdi.
Tātad, tagad jūs varat veikt šos kontrastējošos paziņojumus visās šajās valodās, pat tos, kuriem ir patiešām smagas vienošanās noteikumi, jo mēs esam izstrādājuši šo jauno, uz veidni balstīto pieeju aizspriedumu novērtēšanai, kas ir sintaktiski jutīga.
Ir zināms, ka ģeneratīvā AI jau kādu laiku pastiprina stereotipus. Tā kā citos AI pētniecības aspektos tiek panākts tik liels progress, kāpēc šāda veida ekstrēmie aizspriedumi joprojām ir izplatīti? Tas ir jautājums, kas šķiet nepietiekami adresēts.
Tas ir diezgan liels jautājums. Ir daži dažādi atbildes. Viens no tiem ir kultūras. Es domāju, ka daudzos tehnoloģiju uzņēmumos tiek uzskatīts, ka tā nav īsti tik liela problēma. Vai arī, ja tas ir, tas ir diezgan vienkāršs labojums. Kas par prioritāti tiks noteikts, ja kaut kas tiek noteikts prioritāšu, ir šīs vienkāršās pieejas, kas var noiet greizi.
Mēs iegūsim virspusējus labojumus ļoti pamata lietām. Ja jūs sakāt, ka meitenēm patīk rozā, tas atzīst, ka kā stereotips, jo tā ir tikai tāda veida lieta, ka, ja jūs domājat par prototipiskiem stereotipiem, jums parādās, vai ne? Šie ļoti pamata gadījumi tiks apstrādāti. Tā ir ļoti vienkārša, virspusēja pieeja, kurā šie dziļāk iegultie uzskati netiek risināti.
Tas galu galā ir gan kultūras jautājums, gan tehnisks jautājums, kā atrast, kā iegūt dziļi iesakņojušos aizspriedumus, kas sevi neizsaka ļoti skaidrā valodā.