Management

Datamanagement
papierwerk

Doe eens een stap terug!

‘Vuile’ data kost ons zo’n 600 miljard dollar per jaar.

© CC0,  Pixabay
13 juli 2017

Beslissingen nemen op basis van data, wie wil dat nu niet? We kunnen met data de toekomst voorspellen, fraude voorkomen, epidemieën indammen en nieuwe afzetmarkten blootleggen. Het kan niet op.

Maar uit ons enthousiasme om datagedreven te zijn, gaan we soms een tikkeltje te snel en vergeten we de basis. Data wordt niet goed geprepareerd en opgeschoond, met als gevolg dat belangrijke beslissingen genomen worden op basis van onbetrouwbare analyses. Of we beveiligen data niet voldoende, waardoor we als bedrijf aan grote risico’s worden blootgesteld. Of er slingeren in één organisatie diverse kopieën van databronnen rond, waardoor consistentie ver te zoeken is. Kortom: soms is het beter om een stapje terug te doen. In deze blog geef ik drie tips voor een goede basis.

1. Collaborative governance
‘Vuile’ data kost ons zo’n 600 miljard dollar per jaar. Het is dus evident dat data correct en accuraat moet zijn. Maar hoe meer data we hebben, hoe lastiger het is om de kwaliteit te bewaken. Want bij wie beleg je de verantwoordelijkheid voor de kwaliteitscontrole van al jouw data? Collaborative data governance, waarbij iedereen in een organisaties samenwerkt aan schone, veilige en accurate data, kan je hierbij helpen. Zoals het woord ‘collaborative’ al aangeeft, gaan met dit model medewerkers samenwerken aan data-governance. Medewerkers worden zelf verantwoordelijk voor het corrigeren, kwalificeren en opschonen van data waar zij het meeste verstand van hebben. Dat wil zeggen dat de marketeer de lijst met prospects opschoont terwijl sales de belangrijkste contacten bijwerkt en een financieel analist verantwoordelijk is voor het corrigeren en de kwaliteit van de budget sheet. Een win-win voor iedereen.

2. Security & compliance
Naast de juistheid van data, is de beveiliging ervan minstens zo belangrijk. De aankomende GDPR wetgeving dwingt bedrijven in Europa om hun datamanagementstrategie te herzien. Een van de zaken die de GDPR voorschrijft is dat organisaties te allen tijde moeten weten waar hun data staat opgeslagen, wie het gebruikt en wie er verantwoordelijk voor is. Bij veel bedrijven is dit niet altijd duidelijk. Data is versnipperd opgeslagen, iedere afdeling werkt met eigen bronnen en data staat zowel in de cloud als ‘op de grond’. Hierdoor is het vrijwel onmogelijk om een centraal klantbeeld te krijgen, waardoor je als bedrijf niet of erg lastig kan voldoen aan het ‘recht om vergeten te worden’ – dat wel door de GDPR wordt voorgeschreven. Mijn gouden tip voor ieder bedrijf is dan ook om eerst in kaart te brengen welke data je verzamelt en waar alles staat opgeslagen. In de meest ideale situatie werk je toe naar één big data-platform waarop alle databronnen samenkomen. Breng hier alle informatie uit al jouw systemen samen om één totaaloverzicht te krijgen.

3. Datawoordenboek
Nu het volume van data dagelijks toeneemt, zetten steeds meer bedrijven in op big data. Frameworks zoals Apache Hadoop zorgen ervoor dat het steeds eenvoudiger en goedkoper is om te werken met écht grote hoeveelheden. Het zogenoemde ‘data lake’ is dan ook in opkomst. Dit is de verzamelplaats van alle (meestal ruwe en ongestructureerde) data die je nader wilt doorzoeken, bestuderen en analyseren. Het doorzoeken ervan kan echter tijdrovend zijn. Investeer daarom in een vooraf geconfigureerd datawoordenboek waarmee je de betekenis van ruwe data automatisch kan herkennen. Gebruikers kunnen ook hun eigen ‘vocabulaire’ (zoals productcodes en -namen) hieraan toevoegen. Natuurlijk kost het tijd om op te zetten, maar het helpt jou en je organisatie om met een muisklik datatoepassingen te herkennen.

Met deze drie tips bouw je aan een betrouwbare datamanagementstrategie. Zo verzeker je jezelf ervan dat je bent voorbereid op nieuwe wetgeving, dat jouw data altijd juist is en dat het makkelijk terug te vinden is. Natuurlijk is data management een het continu proces, maar het moet in de basis goed zijn. Ik ben benieuwd naar jullie aanvullende tips.

Reactie toevoegen
1
Reacties
Anoniem 17 juli 2017 13:26

M.I. zijn er twee grote problemen.
1) De meeste data is niet oneindig lang houdbaar, maar er wordt bij invoer geen uiterste houdbaarheidsdatum aan gehangen. Na die UHD zou je de data moeten verversen of verwijderen. Zelfs een invoerdatum ontbreekt vaak zodat je dat zelfs geen impliciete UHD kunt toepassen.
2) Data heeft vaak geen eigenaar (meer). In principe is bijvoorbeeld degene die NAW gegevens in een CRM klopt of laat kloppen de (probleem)eigenaar van die data. Bij vertrek van deze medewerker zou het eigenaarschap van deze data geschoond moeten worden overgedragen dan wel verwijdert. Dat gebeurt niet en dan kom je op een punt waarop het onhaalbaar is om iemand die er totaal geen binding mee heeft even 10.000 records te laten checken op consistentie.