Home Tehnoloģija Kāpēc atvērtais avots var nepārdzīvot ģeneratīvā AI pieaugumu?

Kāpēc atvērtais avots var nepārdzīvot ģeneratīvā AI pieaugumu?

13
0

aire pictures / Second / Getty Photos

Sekojiet ZDNET: Pievienojiet mūs kā vēlamo avotu Google tīklā.


ZDNET galvenās atziņas

  • Ģeneratīvais AI izdzēš atvērtā pirmkoda izcelsmi.
  • FOSS savstarpīgums sabrūk, kad pazūd attiecinājums un īpašumtiesības.
  • Kopējie, kas izveidoja AI, var neizdzīvot tā panākumus.

Mēs dzīvojam pārsteidzošā, uz tehnoloģijām balstītā pasaulē, kuru darbina programmatūra un kas ir atkarīga no tās. Šī programmatūra nodrošina mūsu tīklus, mūsu drošību, mūsu finanšu darījumus, mūsu piegādes ķēdes pārvaldību un, protams, ģeneratīvās AI sistēmas, kas ir vissvarīgākās gandrīz ikvienam.

Wager no kurienes rodas šī digitālā infrastruktūra? Gandrīz viss ir balstīts uz bezmaksas un atvērtā pirmkoda programmatūru, ko nozare sauc par FOSS. Šis ir kods, ko izveidojušas ļoti sadarbīgas kopienas, kuras virza kodētāji, kuri izmanto FOSS augļus un kuri arī aktīvi veicina kļūdu labojumus un uzlabojumus.

Arī: kā AI kodēšanas aģenti var iznīcināt atvērtā pirmkoda programmatūru

Šī kodā sniegto ieguldījumu savstarpīgums ir FOSS pamatā, kas to veido mūsdienu sabiedrības pamatā. Mūsu atvērtā pirmkoda infrastruktūras pārsteidzošākais ir tas, ka to regulē pamatlīgumi par koda izcelsmi.

Izcelsme un copyleft

Jābūt iespējai izsekot katru koda rindiņu līdz tās radītājam. Šo FOSS galveno izcelsmes elementu bieži regulē tā sauktās “copyleft” licences. Copyleft būtībā ir pretējs autortiesībām (tātad arī cutesy termins). Autortiesības ierobežo izmantošanu un modifikācijas bez īpašnieka atļaujas, guess copyleft prasa koplietot modificēto kodu ar tādiem pašiem noteikumiem kā sākotnējais kods.

Tāpat: Eiropas plāns atteikties no ASV tehnoloģiju gigantiem ir balstīts uz atvērtā pirmkoda, un tas kļūst arvien populārāksViens

Mēs nesen saskārāmies ar vēl vienu milzīgu izcelsmes jautājumu ar OpenAI Sora 2, kas spēj atveidot reālu cilvēku līdzības un balsis. Par manu dziļo niršanu par Sora 2 jautājumiem man bija iespēja runāt ar Šons O’BraiensJēlas Juridiskās skolas Jēlas privātuma laboratorijas dibinātājs.

Tomēr mūsu sarunā mēs neaprobežojāmies ar ģeneratīvā AI video apspriešanu, lai apspriestu ģeneratīvā AI un paša koda galvenās problēmas. Šons saka: “Programmatūras izstrādei tas rada bīstamu situāciju. Patentēta vai copyleft savstarpēja koda fragmenti var iekļūt AI ģenerētajos izvados, piesārņojot kodu bāzes ar materiāliem, kurus izstrādātāji nevar reāli pārbaudīt vai pareizi licencēt.”

Citiem vārdiem sakot, tas noslēpj visu izcelsmes problēmu, kas nosaka ne tikai programmatūras izstrādātāju, guess arī tās piederību, kas par to ir atbildīgs un kādas tiesības tiek nodotas ar to. Šons saka, ka mākslīgā intelekta koda ģenerēšana šobrīd rada tīšas akluma kultūru pret FOSS licencēšanu, ja ne tiešu naidīgumu pret tādām licencēm kā GNU GPL (viena no galvenajām licencēm, kas regulē atvērtā pirmkoda kodu).

Arī: vai AI pat var būt atvērtā koda? Tas ir sarežģīti

Tā kā FOSS licencēm gandrīz vienmēr ir nepieciešams attiecinājums un bieži vien arī pārdalīšana ar identiskiem noteikumiem, autorības līnijas tiek izplūdušas, kad AI izvade ir sajaukta. Tas padara licences atbilstību praktiski neiespējamu.

Juridiskā pelēkā zona

Sora 2 rakstā viņš aprakstīja četru daļu doktrīnu, kas veidojas ASV tiesību aktos. Rezumējot, pirmkārt, tikai cilvēku radīti darbi ir aizsargāti ar autortiesībām. Otrkārt, ģeneratīvās AI izvades plaši tiek uzskatītas par neautortiesīgām un pēc noklusējuma tiek uzskatītas par “publisku domēnu”. Treškārt, cilvēks vai organizācija, kas izmanto AI sistēmas, ir atbildīga par jebkādiem pārkāpumiem ģenerētajā saturā. Un, visbeidzot, apmācība par ar autortiesībām aizsargātiem datiem bez atļaujas ir likumīga un nav aizsargāta ar neskaidrībām.

FOSS vienmēr ir bijusi atkarīga no abpusējas ekosistēmas. GNU GPL un līdzīgas copyleft licences ir atkarīgas no izsekojamības. Viņš saka, ka, atkārtoti izmantojot kodu, izstrādātāji zina tā izcelsmi un pienākumus. Šie pienākumi, piemēram, attiecināšana, pārdalīšana un uzlabojumu ieguldījums augšup, ir tie, kas papildina kopējo īpašumu.

Tāpat: 3 padomi, kā orientēties atvērtā pirmkoda AI barā — 4M modeļi un skaitīšana

Atvērtā programmatūra vienmēr ir rēķinājusies ar tās koda regulāru papildināšanu. Kā daļu no tā lietošanas procesa lietotāji to modificē, lai to uzlabotu. Tie pievieno funkcijas un palīdz garantēt lietojamību visās tehnoloģiju paaudzēs. Tajā pašā laikā lietotāji uzlabo drošību un aizlāpa caurumus, kas var apdraudēt visus.

Wager O’Braiens saka: “Kad ģeneratīvās AI sistēmas uzņem tūkstošiem FOSS projektu un atgrūž fragmentus bez izcelsmes, savstarpīguma cikls sabrūk. Ģenerētais fragments šķiet bez izcelsmes, tam nav licences, autora un konteksta.”

Tas nozīmē, ka pakārtotais izstrādātājs nevar jēgpilni ievērot savstarpējos licencēšanas noteikumus, jo izvade pārtrauc cilvēka saikni starp kodētāju un kodu.

“Licences amnēzija”

Pat ja inženierim ir aizdomas, ka mākslīgā intelekta ģenerēta koda bloka izcelsme ir atvērtā pirmkoda licence, nav iespējams identificēt avota projektu. Apmācības dati ir abstrahēti miljardos statistisko svaru, kas ir likumīgs melnā cauruma ekvivalents.

Rezultāts ir tas, ko O’Braiens sauc par “licences amnēziju”. Viņš saka: “Kods ir brīvs no sava sociālā līguma, un izstrādātāji nevar atdot, jo viņi nezina, kur nosūtīt savus ieguldījumus.”

Tāpat: Anthropic atvērtā pirmkoda drošības rīks atklāja, ka mākslīgā intelekta modeļi ziņoja nepareizās vietās

Jēlas O’Braiens saka, ka mūsdienu programmatūras industrija un patiešām milzīgs globālās ekonomikas segments ir parādā savu pastāvēšanu FOSS un šai idejai par intelektuālo resursu digitālo kopienu. Mēs to saucam par “atvērto avotu”, guess O’Braiens apgalvo: “Šis termins ir ne tikai neprecīzs, guess arī ignorē, ka programmatūras izstrāde 21. gadsimtā ir ekoloģiska sistēma. Šī sistēma balstās uz FOSS projektiem un koda pakārtotajiem saņēmējiem, kuri to ņem un remiksē vēl lielākā programmatūrā.”

Tāpat: Atvērtā pirmkoda prasmes var glābt jūsu karjeru, kad AI sāk klauvēt

“Kad mākslīgā intelekta apmācības komplektos ir ietverts gadu desmitiem ilgas atklātas sadarbības kolektīvs darbs, globālā kopienas ideja, kas ir pamatota ar repo un kodiem visā pasaulē, var kļūt par neatjaunojamu resursu, kas tiek iegūts un nekad netiek papildināts,” saka O’Braiens. “Kaitējums neaprobežojas tikai ar juridisko nenoteiktību. Ja FOSS projekti nevar paļauties uz līdzstrādnieku enerģiju un darbu, lai palīdzētu viņiem salabot un uzlabot savu kodu, nemaz nerunājot par drošības problēmu ielāpu, būtiski svarīgi programmatūras komponenti, uz kuriem pasaule paļaujas, ir apdraudēti.”

Šeit ir milzīga ironija

O’Braiens nosaka posmu: “Šo brīdi īpaši traģisku padara tas, ka infrastruktūra, kas nodrošina ģeneratīvo mākslīgo intelektu, ir radusies no kopējām lietām, ko tā tagad patērē. Bezmaksas un atvērtā pirmkoda programmatūra izveidoja internetu: no Linux kodoliem, kuros darbojas serveri, līdz Apache un Nginx, kas nodrošina tīmekli, līdz PostgreSQL un MySQL datu pārvaldības datiem, līdz Python, GCC (GNU CompisorFlow kolekcija), un TensorFlow kolekcija. veicinot mašīnmācīšanās revolūciju. Katrs mākoņa pakalpojumu sniedzējs, katrs hipermēroga datu centrs, katrs LLM cauruļvads atrodas uz FOSS pamata.”

Tāpat: Kā AI kodēšanas aģenti var iznīcināt atvērtā pirmkoda programmatūru

Tūkstošiem brīvprātīgo uzturētāju, studentu, pētnieku un mazu kolektīvu izveidoja un uzturēja FOSS projektus, uz kuriem vēlāk korporācijas veidoja savu bagātību. O’Braiens saka: “Tagad šīs pašas korporācijas izmanto šo bagātību un aprēķinus, lai apmācītu necaurredzamus modeļus uz tām pašām kodu bāzēm, kas padarīja iespējamu to pastāvēšanu, un apdraud juridiskās struktūras, piemēram, savstarpējās vai copyleft licences, piemēram, GNU GPL, marķējot visas genAI tērzēšanas robotu izvades.

Viņš saka, ka, to darot, viņi izjauc apstākļus, kas padarīja FOSS sadarbību dzīvotspējīgu.

Apakšējā līnija ir šāda. Jēlas privātuma guru saka: “Ja mēs neatzīstam, ka FOSS nav tikai licencēšanas režīms, guess arī pilsoniskā infrastruktūra, tad nākamā izstrādātāju paaudze mantos pasauli, kurā kodēšana ir privatizēta, vēsture ir aizklāta un pats internets kļūs par vēl vienu slēgtu koda platformu, ko LLM darbināmi tērzēšanas roboti apzīmē ar publisko domēnu un ir bloķēti.”

Tāpat: Trampa AI plāns daudz saka par atvērto avotu, taču šeit ir norādīts, ko tas atstāj

O’Braiens saka: “Kopējie nekad nav bijuši tikai par brīvu kodu. Tas bija par brīvību veidot kopā.” Šī brīvība un kritiskā infrastruktūra, kas ir gandrīz visas mūsdienu sabiedrības pamatā, ir apdraudēta, jo attiecināšana, īpašumtiesības un savstarpīgums tiek izplūduši, kad mākslīgais intelekts uztver visu internetā un to atmazgā (naudas atmazgāšanas analoģija ir piemērota), tādējādi visa šī koda izcelsme tiek aizēnota.

Kā tu domā? Vai AI apdraud pašus atvērtā koda pamatus, vai arī FOSS kopiena var pielāgoties šai jaunajai realitātei? Vai jūs uzskatāt, ka mākslīgā intelekta radītajam kodam ir jāuzņemas tādi paši licencēšanas pienākumi kā cilvēka rakstītam kodam? Kā izstrādātājiem un uzņēmumiem būtu jānodrošina attiecināšana un savstarpīgums, izmantojot AI rīkus? Paziņojiet mums tālāk sniegtajos komentāros.

Vai vēlaties vairāk stāstu par AI? Pārbaudiet AI līderu sarakstsmūsu iknedēļas biļetens.


Jūs varat sekot līdzi maniem ikdienas projektu atjauninājumiem sociālajos medijos. Noteikti abonējiet mans iknedēļas atjauninājumu biļetensun sekojiet man Twitter/X plkst @DavidGewirtzFb plkst Facebook.com/DavidGewirtzInstagram plkst Instagram.com/DavidGewirtzvietnē Bluesky plkst @DavidGewirtz.comun vietnē YouTube plkst YouTube.com/DavidGewirtzTV.



avots