Scannen boekteksten zegen voor de wetenschap
“Bij het scannen van oude boeken die minder fragiel zijn, worden de bladzijden opgenomen met een speciale camera. Een mens zorgt voor het omslaan van de bladzijden. Er zijn wel robots die dat kunnen doen, maar de kans dat een boek dan stukgetrokken wordt is groot. En dan zijn er de boeken die niet bewaard hoeven te blijven. Daar snijden we de rug van af, waarna de pagina’s snel door een scanner worden gehaald.”
Door het scannen van boeken en het gebruik van OCR ontstaat een zeer grote hoeveelheid teksten die kunnen dienen als basis voor wetenschappelijk onderzoek. “Je kunt bijvoorbeeld kijken wanneer bepaalde woorden in ge- of juist onbruik zijn geraakt. Ook kunnen onderzoekers twee woorden met elkaar vergelijken, om zo uitspraken te doen over taalgebruik en de veranderingen daarin”, zegt Orwant.