Home Tehnoloģija Reddit bloķē interneta arhīvu no pārmeklēt savus datus – lūk, kāpēc

Reddit bloķē interneta arhīvu no pārmeklēt savus datus – lūk, kāpēc

22
0

Andriy Onufriyenko/Getty Pictures

ZDNET galvenie pārņemšana

  • Interneta arhīvs tagad var pārmeklēt tikai Reddit mājas lapu.
  • Reddit mērķis ir bloķēt AI firmas no Reddit lietotāja datu nokasīšanas.
  • Izdevēji (un citi) iesūdz AI uzņēmumus par autortiesību pārkāpumiem.

Reddit aizstāv savu privātumu no AI uzņēmumiem, kuri izvēlas apļveida pieeju tā satura nokasīšanai.

Sociālo mediju platforma, kas pazīstama kā resurss, kurā lietotāji var ievietot anonīmi un atrast informāciju par praktiski jebkuru priekšmetu, bloķēs interneta arhīvu Ceļvedis no tiešsaistes datu indeksēšanas, liecina pirmdiena ziņot no robežas. Pārcelšanās ir reakcija uz atklājumu, ka AI firmas, nespējot nokasīt datus no Reddit tieši platformas aizliegtā politikas dēļ, tā vietā ir izguvuši savus datus no indeksētā satura interneta arhīvā un izmantojuši to apmācības modeļiem.

Wayback Machine tagad varēs nokasīt datus no Reddit mājas lapas, saskaņā ar The Verge, savukārt piekļuve lietotāju profiliem, komentāriem un detalizētām lapām tiks bloķētas.

Interneta arhīvs, kas tika atklāts 1996. gadā, ir bezpeļņas organizācija, kas darbojas milzīga tīmekļa satura digitālā datu bāze. Arhīvu daļēji uztur Wayback Machine-tīmekļa retināšanas programmatūras gabals, kas apkopo tīmekļa lapas un saglabā tās, kad tie parādījās, kad tie tika savākti, piemēram, digitālās mušas dzintarā. Tas kalpo kā resurss pētniekiem, kas cita starpā pēta tiešsaistes kultūras un digitālo kriminālistikas pierādījumu attīstību, cita starpā.

Ko nozīmē Reddit kustība

Reddit iepriekš ir atzīmējis bažas, kas saistītas ar tā satura nokasīšanu ar interneta arhīvu, saskaņā ar The Verge. Tiek ziņots, ka bezpeļņas organizācija arī tika paziņota, pirms vakar sāka stāties spēkā tīmekļa retināšanas ierobežojumi.

Interneta arhīvam vēl nav jāsniedz oficiālais paziņojums par to, kā tā plāno reaģēt uz Reddit jaunajiem ierobežojumiem, un rakstīšanas laikā tas nav atbildējis uz ZDNet pieprasījumu komentēt. Wayback Machine direktors Marks Grehems tomēr ir teicis vairākām publikācijām, ka interneta arhīvs “turpinās notikt notiekošās diskusijas par šo jautājumu” ar Reddit.

Pieaugoša spriedze

Reddit ziņotais lēmums bloķēt Wayback Machine no tā, ka lielākā daļa tā satura tiek parādīts, palielinot spriedzi starp AI uzņēmumiem un digitālajiem izdevējiem, lai gan Reddit ir pirmais tehnoloģiju uzņēmums, kas ienāca debatēs. Uzņēmums jūnijā iesūdzēja antropic, atklājot, ka AI uzņēmums nelikumīgi nokasīja savus datus, taču tas arī iepriekš ir parakstījis licencēšanas darījumus gan ar Google, gan Openai.

(Informācijas atklāšana: Zdnet mātesuzņēmums Zifs Deiviss iesniedza 2025. gada aprīļa tiesas procesu pret Openai, apgalvojot, ka tas pārkāpj Ziff Davis autortiesības apmācībā un darbībā tās AI sistēmās.)

AI izstrādātājiem ir nepieciešama piekļuve Gargantuan informācijas tradēm, lai apmācītu ģeneratīvus AI modeļus, kas ir paredzēti, lai identificētu un atkārtotu smalkos matemātiskos modeļus, kas iegūti no šīm apmācības datu kopām.

Daudzi no šiem uzņēmumiem ir nokasījuši apmācības datus no publiski pieejamām vietnēm, tostarp sociālo mediju vietnēm un ziņu noieta vietām, pieprasot likumīgu imunitāti saskaņā ar koncepciju, kas zināma autortiesību likumā godīga lietošanaApvidū (Tiesas joprojām atceļ šī argumenta leģitimitāti un, iespējams, to darīs kādu laiku.)

Daudzas organizācijas, kuru saturs ir daudz nokasīts – kopā ar autoru un citu mākslinieku kohortu – ir atbildējušas ar tiesas prāvām.

Tikmēr citi ir parakstījuši satura licencēšanas līgumus ar tādiem kā Openai, Anthropic un Google, piekrītot viņu organizāciju datu izmantošanai apmaiņā pret paaugstinātu redzamību atbildēs, ko rada tērzēšanas roboti vai citi ieguvumi.



avots