Kas ir Nākotnes poga, kas patīk mākslīgā intelekta laikmetā? Makss Levčins – Paypal līdzdibinātājs un apstiprinājis izpilddirektoru – ieņem jaunu un ļoti vērtīgu lomu, lai patiktos datus apmācītu AI, lai izdarītu secinājumus vairāk saskaņā ar tiem, ko pieņemtu lēmumu pieņemšanas lēmums.
Tas ir plaši pazīstams strīds mašīnu apguvē, ka dators, kas pasniegts ar skaidru atlīdzības funkciju, iesaistīsies nerimstošā pastiprināšanas mācībā, lai uzlabotu savu veiktspēju un palielinātu šo atlīdzību, wager tas, ka šis optimizācijas ceļš bieži noved AI sistēmas uz ļoti atšķirīgiem rezultātiem, nekā tas varētu izraisīt cilvēkiem, kuri izmanto cilvēku spriedumu.
Lai ieviestu koriģējošu spēku, AI izstrādātāji bieži izmanto tā saukto pastiprināšanas mācīšanos no cilvēku atsauksmēm (RLHF). Būtībā viņi ieliek cilvēka īkšķi mērogā, kad dators ierodas savā modelī, apmācot to datiem, kas atspoguļo reālu cilvēku faktiskās vēlmes. Guess no kurienes nāk šie cilvēku izvēles dati, un cik daudz no tiem ir nepieciešami, lai ievade būtu derīga? Pagaidām tā ir bijusi RLHF problēma: tā ir dārga metode, ja tai nepieciešama cilvēku uzraudzības un anotatoru pieņemšana darbā, lai ievadītu atgriezenisko saiti.
Un tā ir problēma, kuru Levchin domā, ka varētu atrisināt ar līdzīgu pogu. Viņš uzskata uzkrāto resursu, kas mūsdienās atrodas Fb rokās kā nelaime jebkuram izstrādātājam, kurš vēlas apmācīt inteliģentu aģentu par cilvēku izvēles datiem. Un cik liels ir darījums? “Es iebilstu, ka viena no visvērtīgākajām lietām, kas pieder Fb, ir tas, ka patika dati,” mums sacīja Levčins. Patiešām, šajā lēciena punktā mākslīgā intelekta attīstībā, kurai ir piekļuve “kādam saturam, kas patīk cilvēkiem, ko izmantot AI modeļu apmācībai, iespējams, ir viena no savdabīgāk vērtīgākajām lietām internetā”.
Lai gan Levchin paredz, ka AI mācās no cilvēku vēlmēm, izmantojot līdzīgu pogu, AI jau maina veidu, kā šīs preferences tiek veidotas, pirmkārt. Faktiski sociālo mediju platformas aktīvi izmanto AI ne tikai, lai analizētu patīk, wager arī paredzētu tās – potenciāli padarot pati pogu novecojušu.
Tas mums bija pārsteidzošs novērojums, jo, kā mēs runājām ar lielāko daļu cilvēku, prognozes lielākoties nāca no cita leņķa, aprakstot nevis to, kā līdzīgā poga ietekmēs AI veiktspēju, wager gan to, kā AI mainītu pogas Patīk pasauli. Jau mēs dzirdējām, ka AI tiek izmantots, lai uzlabotu sociālo mediju algoritmus. Piemēram, 2024. gada sākumā Fb eksperimentēja ar Izmantojot AI Lai pārveidotu algoritmu, kas lietotājiem iesaka videoklipus. Vai tas varētu nākt klajā ar labāku mainīgo svērumu, lai prognozētu, kuru videoklipu lietotājs visvairāk vēlētos skatīties tālāk? Šī agrīnā testa rezultāts parādīja, ka tā varētu: piemērot AI uzdevumam, kas atmaksāts ilgākā pulksteņa laikā – veiktspējas metrika Fb cerēja palielināt.
Kad mēs pajautājām YouTube līdzdibinātājam Stīvam Čenam, kas ir nākotne, kas paredzēta līdzīgu pogai, viņš sacīja: “Es dažreiz domāju, vai poga, kas patīk, būs nepieciešama, ja AI ir pietiekami izsmalcināta, lai pateiktu algoritmu ar 100 procentiem precizitāti, ko vēlaties noskatīties nākamreiz, pamatojoties uz skatīšanos un koplietošanu paši, līdz pat pašam mērķim ir līdzīgi pogai, kas ir līdzīga, un tā ir līdzīga, un tā ir līdzīga, un tā ir piemērota, un tā ir tāda, kā tā ir līdzīga, un tā ir līdzīga. ir pieejams. ”
Tomēr viņš turpināja norādīt, ka viens no iemesliem, kādēļ vienmēr var būt nepieciešama līdzīga poga, ir veikt asas vai īslaicīgas izmaiņas skatīšanās vajadzībās dzīves notikumu vai situāciju dēļ. “Ir dienas, kad es gribu skatīties saturu, kas ir mazliet atbilstošāks, teiksim, maniem bērniem,” viņš teica. Čens arī paskaidroja, ka līdzīgai pogai var būt ilgmūžība, jo tai ir loma reklāmdevēju piesaistīšanā – citai galvenajai grupai līdztekus skatītājiem un veidotājiem -, jo līdzīgas darbojas kā visvienkāršākā iespējamā eņģe, lai savienotu šīs trīs grupas. Izmantojot vienu pieskārienu, skatītājs vienlaikus vienlaikus sniedz atzinību un atgriezenisko saiti satura nodrošinātājam un pierādījumiem par iesaistīšanos un priekšroku reklāmdevējam.