Više od 340 lokalnih medijskih portala u Sjedinjenim Američkim Državama ograničava pristup internetskoj arhivi Wayback Machine svojim novinarskim sadržajima, pokazuje nova analiza Nieman Laba. Riječ je o nastavku trenda koji je zabilježen početkom godine, kada su veliki izdavači, među njima The New York Times, The Guardian i USA Today Co., počeli blokirati pristup Wayback Machineu zbog zabrinutosti da bi kompanije koje razvijaju vještačku inteligenciju mogle koristiti arhivirane tekstove za treniranje svojih modela.
Prema analizi Nieman Laba, u uzorku je identificirano 382 medija koji ograničavaju barem jednog bota povezanog s internetskom arhivom, a 342 od njih su lokalni mediji. Većina tih portala pripada velikim američkim lancima lokalnih novina, uključujući USA Today Co., McClatchy, Advance Local, MediaNews Group i Tribune Publishing.
Ograničenja se uvode putem robots.txt datoteka, kojima web stranice tehnički signaliziraju pretraživačima i botovima kojim dijelovima stranice mogu ili ne mogu pristupiti. U ovom slučaju, izdavači pokušavaju spriječiti ili ograničiti automatsko arhiviranje svojih tekstova u Wayback Machineu, jednom od najvažnijih javno dostupnih alata za očuvanje internetskog sadržaja.
Iz internetske arhive navode da razgovaraju s izdavačima i da nastoje odgovoriti na njihove zabrinutosti. Osnivač Wayback Machinea Mark Graham rekao je za Nieman Lab da uslovi korištenja ove arhive dopuštaju upotrebu zbirki za potrebe istraživanja i obrazovanja, a ne za masovno komercijalno preuzimanje sadržaja.
Izdavači, međutim, tvrde da žele zaštititi vrijednost svog rada i intelektualno vlasništvo. Advance Local je potvrdio da je počeo blokirati pristup Wayback Machineu još u augustu prošle godine, navodeći da se radi o dijelu šire strategije zaštite objavljenog sadržaja od nepoštene upotrebe trećih strana. Slične mjere uveli su i drugi izdavači, uključujući pojedine publikacije u vlasništvu Alden Global Capitala, kao i Condé Nast i The Atlantic.
Posebno je važan širi kontekst sukoba između medijskih kuća i kompanija koje razvijaju generativnu vještačku inteligenciju. Dio izdavača strahuje da bi se arhivirani tekstovi mogli koristiti kao “zadnja vrata” za pristup njihovom sadržaju, bez direktne dozvole, naknade ili jasnog navođenja izvora. Neki mediji, poput The Baltimore Bannera, tvrde da problem nije sama internetska arhiva, nego način na koji bi AI sistemi mogli koristiti arhivirane tekstove bez odgovarajuće atribucije originalnom mediju.
Kritičari ovakvih blokada upozoravaju da bi posljedice mogle biti ozbiljne za istraživače, historičare, novinare i javnost. Lokalni mediji često predstavljaju jedini trag o događajima u manjim zajednicama, a njihovi arhivi su važan izvor za razumijevanje političkih, društvenih i ekonomskih procesa. Ako se sadržaji ne arhiviraju, postoji rizik da tekstovi nestanu nakon gašenja portala, promjene vlasništva ili prelaska na nove sisteme za upravljanje sadržajem.
Nieman Lab podsjeća da je digitalno arhiviranje skupo i tehnički zahtjevno, posebno za manje redakcije. Prije digitalne ere, mnoge novine imale su fizičke arhive i bibliotekare, dok danas veliki broj lokalnih medija nema resurse za dugoročno čuvanje vlastite građe. Wayback Machine je zato godinama imao važnu ulogu u očuvanju sadržaja koji bi inače mogao nestati iz javnog prostora.
Spor oko internetske arhive tako pokazuje širi problem savremenog novinarstva: kako istovremeno zaštititi autorska prava i ekonomski opstanak medija, a ne ugroziti javni interes, istraživanje i historijsko pamćenje digitalnog doba.
Izvor: Nieman Journalism Lab





