Home Tehnoloģija Wayback Machine momentuzņēmumu arhivēšana strauji samazinās

Wayback Machine momentuzņēmumu arhivēšana strauji samazinās

9
0

Interneta arhīva Wayback Machine ir nenovērtējams resurss, kas dara tieši to, kas teikts bezpeļņas organizācijas nosaukumā: tas arhivē internetu. Interneta arhīvs ir atbildīgs par arhivēšanu 500 miljoni tīmekļa lapu dienā.

Tomēr pēdējos mēnešos platformā ir notikušas nopietnas izmaiņas. Saskaņā ar jauno ziņojumu Nīmana laboratorijaInterneta arhīva Wayback Machine pēdējā laikā arhivē noteiktas vietnes daudz retāk. Vēl vairāk: daudzas no šīm vietnēm ir saistītas ar ziņām.

Saskaņā ar Neiman Lab ziņojumu, Wayback Machine laikā no 2025. gada 1. janvāra līdz 15. maijam arhivēja 1,2 miljonus momentuzņēmumu no 100 lielāko ziņu vietņu mājaslapām. Tomēr maija vidū tas pēkšņi mainījās.

No 2025. gada 17. maija līdz 1. oktobrim Wayback Machine uzņēma tikai 148 628 momentuzņēmumus no tām pašām 100 ziņu vietņu mājaslapām. Tas ir milzīgs arhivēto lapu skaita samazinājums starp gada pirmajiem četriem mēnešiem un iepriekšējiem pieciem mēnešiem.

Piemēram, CNN mājaslapu Wayback Machine arhivēja 34 524 reizes laikā no 1. janvāra līdz 15. maijam. Kopš tā laika tikai 1903 mājaslapas momentuzņēmumi ir Wayback Machine.

Mashable gaismas ātrums

SKATĪT ARĪ:

Interneta arhīvs tikko kļuva par oficiālu ASV federālo bibliotēku

Mashable jūlijā ziņoja, ka, pateicoties a jauns apzīmējums Kalifornijas senators Alekss Padillas, Interneta arhīvs pievienosies tīklam, kurā ir vairāk nekā 1000 bibliotēku visā valstī, kuru uzdevums ir arhivēt valdības dokumentus publiskai apskatei.

Marks Grehems, Wayback Machine direktors, pastāstīja Nieman Lab, ka “dažu konkrētu arhivēšanas projektu sabrukums maijā … izraisīja mazāku arhīvu izveidi dažām vietnēm.” Pēc Grehema teiktā, dažiem trūkstošajiem momentuzņēmumiem vēl nav izveidota indeksa struktūra, un tie drīz tiks pievienoti Wayback Machine arhīvam.

Kā norādīja Nieman Lab, piecu mēnešu kavēšanās indeksa problēmu dēļ ir retums. Saskaņā ar Greiema teikto, interneta arhīvs ir piedzīvojis kavēšanos “dažādu darbības iemeslu” dēļ, piemēram, “resursu piešķiršanas dēļ”. Interneta arhīvs nenorādīja vai nesniedza vairāk informācijas Nieman Lab par šo problēmu.

Laikraksti jau sen ir arhivēti vēstures glabāšanai. Tomēr interneta laikmetā lielākā daļa laikrakstu, izņemot mantotos plašsaziņas līdzekļu gigantus, pēdējā laikā lielākoties nav arhivēti. Ziņu mediju vietnes ir ieņēmušas savu vietu kā vēsturiskais ieraksts. Kopš 1996. gada interneta arhīvs ir uzņēmies atbildību par šo tīmekļa lapu arhīvu glabāšanu.

Tomēr pēdējos gados bezpeļņas organizācija ir piedzīvojusi grūtības. Kā ziņo Nieman Lab, interneta arhīva izdevumi 2023. gadā bija 32,7 miljoni USD. Ir nepieciešams daudz resursu, lai ne tikai pārmeklētu internetu, guess arī saglabātu datus. Bezpeļņas organizācija tajā pašā gadā ienesa tikai 23 miljonus ASV dolāru.

Turklāt interneta arhīvs pērn oktobrī kļuva par upuri a milzīgs datu pārkāpums kas vietni kopā ar Wayback Machine padarīja bezsaistē. Pagāja nedēļas, līdz vietne tika pilnībā atjaunota.

avots

LEAVE A REPLY

Please enter your comment!
Please enter your name here