Novinarski sadržaj ključan je za odgovore alata generativne umjetne inteligencije, pokazuje novo izvještaj Generative Pulse platforme Muck Rack.
Autori izvještaja analizirali su više od milion citata koje su generirali AI modeli. Novinarski sadržaj bio je citiran u više od 27 posto slučajeva u svim testovima Muck Racka.
Kada su u pitanju upiti koji zahtijevaju „određeni nivo ažurnosti“ (ne samo udarne vijesti, već i aktuelne teme poput „nestašica rent-a-car vozila u SAD-u“ ili „najsavremenije metode liječenja ovisnosti u ambulantnim uslovima“), taj broj raste na 49 posto, što znači da gotovo polovina svih citata dolazi iz novinarstva.
Testovi su uključivali modele GPT-4o i 4o Mini, Gemini Flash i Pro, te Claude Sonnet i Haiku.
Kada ChatGPT i slični AI alati formuliraju odgovore, mogu se oslanjati samo na podatke s kojima su trenirani. Muck Rack je potvrdio da, ako se modelima onemogući korištenje citata i pristup internetu u realnom vremenu, često proizvode netačne ili zastarjele informacije.
Također je utvrđeno da vrsta pitanja značajno mijenja izvore citiranja. Subjektivna pitanja, poput traženja savjeta ili korak-po-korak uputa, mnogo češće povlače sadržaj s „korporativnih blogova i promotivnih stranica“.
Novinarski sadržaj najčešće se citira u upitima koji zahtijevaju ažurnost, zatim slijede korporativni blogovi i vladini/nevladini izvori.
Claude je najmanje citirao novinarske izvore. Na primjer, Reuters je citirao 20 puta rjeđe nego Gemini, i čak 50 puta rjeđe nego ChatGPT.
Najcitiraniji mediji od strane ChatGPT-a i Geminija bili su: Reuters, Financial Times, Time, Forbes i Axios – svi oni imaju ugovore o korištenju AI tehnologije s OpenAI (izuzev Googlea). Claude, s druge strane, češće citira lakše i specijalizirane izvore kao što su Good Housekeeping, TechRadar i Harvard Business Review.
Kod citata iz novinarskog sadržaja, modeli su preferirali tekstove objavljene u posljednjih 12 mjeseci. Kod ChatGPT-a, 56 posto citata odnosilo se na sadržaj objavljen u zadnjih godinu dana, dok je taj broj kod Claudea iznosio 36 posto.
Analiza je uključivala industrije poput zdravstva, energije i maloprodaje. U sektorima medija/zabave, finansija/osiguranja i vlasti, novinarski izvori bili su daleko zastupljeniji u odnosu na ostale sektore.
Izvor: NiemanLab





