Reddit blokkeert Internet Archive omdat AI-bedrijven er misbruik van maken
Reddit heeft The Internet Archive grotendeels geblokkeerd. Hierdoor kan het digitale archief geen indexatie meer maken van de website en de threads daarop. Volgens het sociale platform was de blokkering nodig, omdat het zag dat AI-scrapers via deze manier toch toegang verkreeg tot afgesloten content.

Het gaat hierbij specifiek om het beperken van de toegang van The Wayback Machine, het onderdeel van The Internet Archive, dat specifiek gericht is op het archiveren van het internet. Reddit zegt dat de machine alleen nog de homepage kan indexeren en geen toegang meer heeft tot alles wat daarna komt, dus effectief heeft het geen toegang meer tot posts, comments en profielen. Het blijft wel mogelijk om een overzicht vast te leggen van de populairste posts van die dag.
"The Internet Archive verleent een dienst voor het open web, maar zijn erop gewezen dat AI-bedrijven gebruiksvoorwaarden overtreden, waaronder ook die van ons, en data scrapen van The Wayback Machine", zegt woordvoerder Tim Rathschmidt van Reddit tegenover The Verge.
Content is waardevol
Met de stap maakt Reddit nog meer duidelijk dat het zichzelf ziet als een waardevolle databron voor AI-training en dat het deze op alle mogelijke manieren ontoegankelijk maakt, tenzij ervoor betaald wordt. Eerder sloot het bedrijf al deals met OpenAI en Google.
Aan de andere kant klaagde Reddit Antropic, de maker van AI-chatbot Claude, aan. Hierbij beweerde de aanklager dat de verdedigende partij willens en wetens nog steeds content van Reddit aan het scrapen was, terwijl dit niet toegestaan was. Anthropic beweert vanzelfsprekend dat dit niet het geval was en dat het al langere tijd gestopt was met het vergaren van data.
Reacties
Om een reactie achter te laten is een account vereist.
Inloggen Word abonnee