12 miljoen oude afbeeldingen gratis op Flickr

Bij het digitaliseren van boeken wordt meteen metadata toegevoegd, die ontstaat door het optisch herkennen van de gescande teksten. "Dat is heel mooi, alleen blijven de afbeeldingen buiten schot. Wie op zoek is naar een oude afbeelding van bijvoorbeeld een olifant, zal handmatig alle plaatjes moeten doorworstelen, er is geen index", aldus Kalev Leetaru.

Redactie AG Connect Meer van deze auteur

Tech & Toekomst — Shutterstock

© Shutterstock

Uploaden en indexeren

Dit was hem een doorn in het oog en daarom besloot Leetaru om een aparte verwerkingsslag voor de afbeeldingen te doen. "Het gaat om plaatjes uit een periode van zo'n 500 jaar die wel zijn gescand - ze staan ten slotte op de pagina's van de boeken - maar waar niemand echt iets mee kan. De afbeeldingen worden nu apart behandeld".

Geautomatiseerd

Ook bij het verwerken van de afbeeldingen wordt optische tekenherkenning gebruikt. In dit geval selecteert de software alleen het bijschrift bij de afbeelding. De tekst wordt uiteengerafeld en omgezet tot metadata. Leetaru kreeg het idee voor dit project toen hij onderzoek deed in opdracht van Yahoo (de eigenaar van Flickr). Inmiddels zijn er zo'n 2,6 miljoen illustraties op deze manier gescand. Iedereen kan de gescande beelden op zijn eigen pc bekijken.