Beheer

Datamanagement
Het risico van foute data

Het risico van foute data

Als opslagruimte onbeperkt is, waarom zou je data dan nog opruimen?

© CC0 - Unsplash Joshua Sortino
5 mei 2021

Veel bedrijven hebben enorme hoeveelheden data opgeslagen. Dit is niet noodzakelijkerwijs gerelateerd aan de werkelijke hoeveelheid opslagruimte die nodig is. Is veel van je data afkomstig uit IoT-apparaten, uit gebruikersdata, of zit je in de wereld van beeld en geluid, dan is opslagruimte relevant. Maar bestaan je data uit platte gegevens, al dan niet in een database, zoals bij heel veel zzp’ers en mkb-bedrijven het geval is, dan is 500 GB al heel veel.

In 500 GB passen gemakkelijk honderdduizenden klantgegevens, productiegegevens of productgegevens en honderdduizenden eenvoudige Word- en Excelbestanden. Dit valt totaal in het niet bij de meer dan 40 zettabytes aan nieuwe data die we vorig jaar met z’n allen wereldwijd hebben geproduceerd. Maar het probleem blijft hetzelfde: hoe manage je die bedrijfskritische data?

Data die niet relevant, verouderd of incorrect zijn, vormen een flink bedrijfsrisico. Gestructureerde data in een database geven je  een onterecht gevoel van zekerheid en leiden tot verkeerde keuzes en beslissingen. Je kunt immers niet met 100% zekerheid bouwen op bijvoorbeeld managementrapportages. Het opschonen en rechttrekken van gestructureerde data is erg belangrijk maar kost tijd.

Als je een bedrijfscultuur hebt waar samenwerken gebeurt door via e-mail bestanden uit te wisselen, is de kans op verkeerde data nog groter

Er zijn bedrijven die data cleansing als dienst aanbieden om je te helpen met name stambestanden te corrigeren, maar het is natuurlijk beter dit regelmatig zelf en proactief te doen. Het opruimen en structureren van onsamenhangende data (bijvoorbeeld in bestanden en zelfs in e-mailboxen) is voor veel werknemers misschien nog wel lastiger. Opslagruimte en de mailboxomvang lijken zeker in de cloud onbeperkt; waarom zou je nog opruimen? Van de fiscus moet je data normaal gesproken sowieso een jaar of zeven bewaren, zelfs e-mailberichten. De reden voor opruimen is niet primair de grote hoeveelheid opslagruimte die wordt gebruikt, maar het risico met verkeerde en oude data te werken.

Data raken out of control. Data worden uit een database geëxporteerd, met Excel bewerkt, geanalyseerd en naar anderen gestuurd. De data bevinden zich zo op minstens drie plekken. Als je een bedrijfscultuur hebt waar samenwerken gebeurt door via e-mail bestanden uit te wisselen, is de kans op verkeerde data nog groter.

Naast het opschonen van gestructureerde data is het daarom de kunst ongestructureerde data onder controle te krijgen. Wat al heel erg helpt, is het uitwisselen en structureren van bestanden en het samenwerken aan bestanden via cloudoplossingen als Microsoft Teams en SharePoint Online. Maar zelfs dan is het zaak goede afspraken te maken ten aanzien van beleid en werkwijzen. En oude data op te ruimen.

Magazine AG Connect

Dit artikel is ook gepubliceerd in het magazine van AG Connect (aprilnummer 2021). Wil je alle artikelen uit dit nummer lezen, klik dan hier voor de inhoudsopgave.

Reactie toevoegen