Beheer

Weekje volstaat om 650.000 e-mails te doorzoeken
Hoe de FBI binnen een week 650.000 e-mails kan controleren.
Hoe de FBI binnen een week 650.000 e-mails kan controleren.
FBI-directeur James Comey liet gisteren in een brief aan het Amerikaanse Congres weten dat afgelopen week alle 650.000 e-mails zijn bekeken die gevonden werden op een laptop van Anthony Weiner. Hij is de man van Clintons naaste assistente Huma Abedin. Daarin bevond zich een aantal e-mails verzonden naar en afkomstig van Hillary Clinton. En die moesten nauwkeurig worden onderzocht.
Wired onderzocht of dit inderdaad een onmogelijke taak was, zoals Trump beweert. En kwam al snel tot de conclusie dat dit geen enkel probleem is.
De FBI hoefde zeker geen 650.000 berichten door te lezen. Zo kon het aantal fors verkleind worden door te filteren op ‘aan’ en ‘van’. Vervolgens konden de e-mails verwijderd worden die ze al eerder geanalyseerd hadden in een langer lopend onderzoek naar de e-mails van Clinton van enkele maanden geleden.
Forensisch expert Jonathan Zdziarski beschrijft hoe dergelijke duplicaten herkend en uitgefilterd kunnen worden aan de hand van hun ID – elk bericht heeft zo’n ID dat bestaat uit een uniek alfanumerieke identificatie.
Forensische tools
Ook duplicaten waarvan de ID’s verschillen doordat ze zijn doorgestuurd of gekopieerd in antwoordberichten kunnen herkend worden. Daarvoor zijn forensische tools voorhanden, zoals Encase of AccessData Forensic Tool Kit. Deze maken hashes van berichten of van delen daaruit. De teksten worden in kortere reeksen karakters geconverteerd die een unieke representatie van de tekst vormen. Door op diezelfde tekst een hashfunctie los te laten krijg je altijd een kleinere reeks karakters. Maar bij elke verandering in de tekst – hoe klein ook – wordt een nieuwe hash gemaakt. Zo kan het programma zeer snel teksten vergelijken en matchen.
Binnen één dag
Dan is het aantal e-mails al een stuk kleiner en kunnen ze gesorteerd worden op ‘thread’. Vervolgens kunnen eenvoudig grote aantallen e-mails over onderwerpen die er voor het onderzoek niet toe doen, worden verwijderd worden. En daarmee is het aantal e-mails dat moet onderzocht worden gereduceerd tot een zeer behapbaar aantal. Zo behapbaar dat beveiliger Rob Graham in zijn blog zich zelfs afvraagt waarom de FBI er acht dagen over gedaan heeft. “Er zijn tools waarmee het doorzoeken van e-mails extreem makkelijk is. Als je die e-mails neemt en je hebt een lijst van bekende e-mailaccounts van Hillary en haar relaties, en een lijst met zoektermen, dan zou ik binnen een paar uur het aantal e-mails kunnen reduceren van 650.000 tot een paar honderd. En die kan één persoon binnen een dag doorgelezen hebben.”
Wat ook relevant is de tijdspanne waarin het aantal berichten is ontvangen c.q. vertuurd. Daarnaast kan ik me niet voorstellen dat iemand (in welke functie dan ook) heel veel unieke berichten verstuurd.
Ik ben eigenlijk wel benieuwd hoeveel reclame berichten en hoeveel relevante berichten er daadwerkelijk door de persoon zelf zijn verstuurd/doorgestuurd. misschien maken meer familieleden ook gebruik van het email adres, wie zal het zeggen.
Gissen doet "de waarheid" missen.