Beheer

Security
Hillary Clinton

Weekje volstaat om 650.000 e-mails te doorzoeken

Hoe de FBI binnen een week 650.000 e-mails kan controleren.

Hillary Clinton © Pixabay,  John Hain
7 november 2016

Hoe de FBI binnen een week 650.000 e-mails kan controleren.

Gisteren maakte de FBI bekend dat Hillary Clinton niet vervolgd wordt om haar e-mails. Rivaal Donald Trump liet echter weten dat het “onmogelijk” is dat de FBI binnen acht dagen 650.000 e-mails kon bekijken om te controleren of hier inderdaad geen sprake was van mogelijke wandaden. Dat kan echter prima, volgens experts. En als het moet ook nog wel binnen één dag.

FBI-directeur James Comey liet gisteren in een brief aan het Amerikaanse Congres weten dat afgelopen week alle 650.000 e-mails zijn bekeken die gevonden werden op een laptop van Anthony Weiner. Hij is de man van Clintons naaste assistente Huma Abedin. Daarin bevond zich een aantal e-mails verzonden naar en afkomstig van Hillary Clinton. En die moesten nauwkeurig worden onderzocht.

Wired onderzocht of dit inderdaad een onmogelijke taak was, zoals Trump beweert. En kwam al snel tot de conclusie dat dit geen enkel probleem is.

De FBI hoefde zeker geen 650.000 berichten door te lezen. Zo kon het aantal fors verkleind worden door te filteren op ‘aan’ en ‘van’. Vervolgens konden de e-mails verwijderd worden die ze al eerder geanalyseerd hadden in een langer lopend onderzoek naar de e-mails van Clinton van enkele maanden geleden.

Forensisch expert Jonathan Zdziarski beschrijft hoe dergelijke duplicaten herkend en uitgefilterd kunnen worden aan de hand van hun ID – elk bericht heeft zo’n ID dat bestaat uit een uniek alfanumerieke identificatie.

Forensische tools

Ook duplicaten waarvan de ID’s verschillen doordat ze zijn doorgestuurd of gekopieerd in antwoordberichten kunnen herkend worden. Daarvoor zijn forensische tools voorhanden, zoals Encase of AccessData Forensic Tool Kit. Deze maken hashes van berichten of van delen daaruit. De teksten worden in kortere reeksen karakters geconverteerd die een unieke representatie van de tekst vormen. Door op diezelfde tekst een hashfunctie los te laten krijg je altijd een kleinere reeks karakters. Maar bij elke verandering in de tekst – hoe klein ook – wordt een nieuwe hash gemaakt. Zo kan het programma zeer snel teksten vergelijken en matchen.

Binnen één dag

Dan is het aantal e-mails al een stuk kleiner en kunnen ze gesorteerd worden op ‘thread’. Vervolgens kunnen eenvoudig grote aantallen e-mails over onderwerpen die er voor het onderzoek niet toe doen, worden verwijderd worden. En daarmee is het aantal e-mails dat moet onderzocht worden gereduceerd tot een zeer behapbaar aantal. Zo behapbaar dat beveiliger Rob Graham in zijn blog zich zelfs afvraagt waarom de FBI er acht dagen over gedaan heeft. “Er zijn tools waarmee het doorzoeken van e-mails extreem makkelijk is. Als je die e-mails neemt en je hebt een lijst van bekende e-mailaccounts van Hillary en haar relaties, en een lijst met zoektermen, dan zou ik binnen een paar uur het aantal e-mails kunnen reduceren van 650.000 tot een paar honderd. En die kan één persoon binnen een dag doorgelezen hebben.”

 

1
Reacties
E. Busscher 07 november 2016 13:56

Wat ook relevant is de tijdspanne waarin het aantal berichten is ontvangen c.q. vertuurd. Daarnaast kan ik me niet voorstellen dat iemand (in welke functie dan ook) heel veel unieke berichten verstuurd.
Ik ben eigenlijk wel benieuwd hoeveel reclame berichten en hoeveel relevante berichten er daadwerkelijk door de persoon zelf zijn verstuurd/doorgestuurd. misschien maken meer familieleden ook gebruik van het email adres, wie zal het zeggen.
Gissen doet "de waarheid" missen.

Reactie toevoegen
De inhoud van dit veld is privé en zal niet openbaar worden gemaakt.