Innovatie & Strategie

Dit is een bijdrage van Veeam
Datamanagement
Veeam_Dataintegrity

Tijd voor data-integriteit

Een essentieel vereiste voor nu, en in de toekomst.

10 mei 2021
Door: Veeam, partner

Een essentieel vereiste voor nu, en in de toekomst.

Analistenbureau IDC publiceerde in maart 2021 een rapport waarin het stelt dat in 2020 wereldwijd meer dan 64 zettabytes (ZB) aan data werd geproduceerd en geconsumeerd. IDC voorspelt tevens dat de hoeveelheid data die in de komende drie jaar geproduceerd zal worden meer zal zijn dan de hoeveelheid data over de afgelopen dertig jaar. En in de komende vijf jaar zal de wereld drie keer zoveel data produceren dan er is geproduceerd in de afgelopen vijf jaar.

Een van de belangrijkste conclusies die je hieruit kan trekken is dat de markt voor data-opslag en data management een uitdagende tijd tegemoet gaat. Een groot deel van deze data zal voor langere tijd beschikbaar moeten blijven. Niet alleen omdat de data nuttig kan zijn voor business-processen, maar ook omdat er specifieke wetgeving omtrent fiscaliteit en compliancy bestaat die dit verplicht maakt. De beschikbaarheid van deze data wordt beschermd door, onder andere, het uitvoeren van backups van zettabytes aan data.

Een backup van je data maken is één. Er zeker van zijn dat deze data, maar juist ook de data waar je actief mee werkt ook écht veilig zijn en niet veranderd of corrupt kunnen worden is twee. Juist omdat data steeds belangrijker worden in een digitaal tijdperk moeten organisaties ervan op aankunnen dat de data waar ze mee werken 100 procent betrouwbaar zijn. Daarbij worden er ook steeds hogere compliance-eisen gesteld aan het beheer en de beschikbaarheid van data. Hoe ziet deze zogenoemde data-integriteit er eigenlijk uit en wat is daarvoor nodig?

Wat is data-integriteit?
De officiële definitie luidt: data-integriteit is de accuratesse en consistentie van data die wordt geborgd door een verzameling processen, regels of standaarden. Door deze regels of standaarden kan de data accuraat en compleet blijven. Andere aspecten van data-integriteit zijn dat data goed leesbaar moet zijn, het juiste formaat moet hebben en origineel moet zijn, dus geen kopie.

De beschikking over veilige, kwalitatieve data is erg belangrijk voor een organisatie. Welke factoren kunnen ervoor zorgen dat deze integriteit in gevaar komt? Dat heeft vaak te maken met menselijke fouten, fouten bij het verplaatsen van data, virussen of hardware die gecompromitteerd is. Om dergelijke fouten te voorkomen raad Veeam het volgende aan:

  1. Beperk de toegang tot uw data. Zakelijke gegevens moeten echt alleen gebruikt worden voor zakelijke toepassingen en daarbij alleen door de juiste mensen. Zorg voor de nodige restricties, bijvoorbeeld op basis van profielen, en voorkom daarmee ongeautoriseerde toegang tot uw waardevolle gegevens.
  2. Neem de tijd voor het valideren van data. Zorg ervoor dat je zeker weet dat de data die je maakt en verzamelt correct en ‘schoon’ is.
  3. Zorg voor een goede backup van je data. Maak gebruik van de Veeam 3-2-1-1-0-regel, waarbij u 3 verschillende kopieën van uw data heeft, op 2 verschillende media waarvan tenminste één kopie offsite opgeslagen is en één kopie air-gapped, onveranderlijk of offline is, om 0 herstelfouten te hebben bij herstelverificatie. Deze backup-regel is echt de backbone van je dataprotectiestrategie.
  4. Audit wanneer data aan je systemen wordt toegevoegd, veranderd of verwijderd. Hou deze veranderingen goed bij. Dit geldt overigens niet voor (al je) backups. Sommige backups moeten juist beveiligd zijn tegen verandering zodat ze bijvoorbeeld niet ‘gegijzeld’ kunnen worden na een ransomware-aanval.
  5. Maak gebruik van error detection-software. Deze software is ontwikkeld om de integriteit van data te beschermen. Het ontdekt abnormaal ‘gedrag’ van data op basis van historische analyse.

Verschillende types van data-integriteit
Data-integriteit kan grofweg gecategoriseerd worden in fysieke en logische integriteit. De fysieke integriteit is sterk afhankelijk van externe factoren zoals stroomuitval tijdens het verplaatsen van data of real life rampen zoals overstromingen of een brand in het datacenter. Maar ook bij het kopiëren van data naar bijvoorbeeld een backup kan zorgen voor disruptie in de data-integriteit. Een goede manier om deze fysieke integriteit te waarborgen is om te zorgen voor een moderne IT-omgeving die het liefst redundant uitgevoerd is en waarvan de basics op bijvoorbeeld het gebied van stroomvoorziening goed zijn geregeld.

De logische integriteit heeft meer te maken met menselijke fouten of fouten in software. Wanneer de logica in de data is verdwenen, is de data niet meer bruikbaar. Neem bijvoorbeeld de integriteit van bedrijfskritische databases. Om deze data logisch te houden, wil je de rationaliteit van de database veiligstellen. Binnen het domein van de logische integriteit bestaan verschillende types die overwogen kunnen worden. Zo moet entity-integriteit ervoor zorgen dat data uniek identificeerbaar is. Referential behoudt de consistentie tussen de tabellen. Domain heeft te maken met het aantal acceptabele waardes die kunnen worden opgeslagen binnen een database en ten slotte kan user-defined-integriteit worden geïmplementeerd via een een set van triggers en procedures.

Databeveiliging en datakwaliteit
Data-integriteit, databeveiliging en datakwaliteit verschillen van elkaar, maar zijn toch met elkaar verbonden. Databeveiliging en datakwaliteit spelen een belangrijke rol om te komen tot data-integriteit.

Datakwaliteit bepaalt of data bruikbaar zijn. Het bepaalt of data compleet, geldig, uniek, tijdig, accuraat en consistent zijn. Als de data niet voldoen aan een van deze criteria, dan zijn de data incompleet en waarschijnlijk inaccuraat.

Databeveiliging omvat een aantal standaarden die gevolgd moeten worden om ervoor te zorgen dat data beschermd zijn tegen ongeautoriseerde toegang of corruptie. Als het gaat om databeveiliging komen vaak de volgende CIA-principes om de hoek kijken: integriteit en beschikbaarheid. Data-integriteit komt in gevaar als data niet veilig zijn en bijvoorbeeld gewijzigd kunnen worden door ongeautoriseerde personen. Zoals je kunt zien lijken de termen op elkaar maar zijn toch verschillend en vooral direct met elkaar verbonden en van elkaar afhankelijk. Een voorbeeld om dit duidelijk te maken…

Stel je een database voor waarin namen en telefoonnummers van een groep mensen zijn opgeslagen. Als 1 cijfer in het telefoonnummer verkeerd is, kun je die specifieke persoon dus niet bellen. Een voorbeeld van slechte data-integriteit. Stel dat iemand die toegang heeft tot deze database een telefoonnummer verandert, dan kan je die persoon niet meer bereiken, kortom de datakwaliteit is niet goed. Of de toegang tot de database is gecompromitteerd en data is veranderd of beschadigd. Dat is een voorbeeld van slechte databeveiliging.

GDPR en data-integriteit
De General Data Protection Regulation (GDPR), die in Nederland vertaald is in de AVG, biedt een juridisch raamwerk met richtlijnen voor het verzamelen en verwerken van persoonlijke informatie van individuen die binnen de Europese Unie wonen. Het maakt daarbij niet uit waar een website gehost wordt, als deze Europese bezoekers aantrekt is de GDPR van toepassing. Om GDPR-compliant te zijn moet je de nodige maatregelen nemen voor het beschermen van persoonlijke gegevens. Een van de zes principes van GDPR is integriteit en vertrouwelijkheid. Dit betekent dat het behouden van de integriteit van data belangrijk is om aan deze regeling te kunnen voldoen. Wanneer de data-integriteit slecht is, zou je dus in overtreding kunnen zijn van deze regelgeving.

Valide en betrouwbaar
In een tijdperk van digitale transformatie is data enorm belangrijk voor elk bedrijf. Veel beslissingen, strategieën en voorspellingen worden genomen op basis van data. Dit maakt het echter ook een interessant doelwit voor cybercriminelen. Een beangstigende trend die ik steeds vaker zie gebeuren in de digitale wereld, is dat hackers beginnen met het toevoegen van gegevens, in plaats van losgeld te vragen voor het simpelweg vrijgeven van data. Het toevoegen van extra gegevens tast de integriteit van een dataset ongemerkt aan, wat het niet alleen onbetrouwbaar, maar ook gevaarlijk maakt om mee te werken.

Om ervoor te zorgen dat de integriteit van uw data optimaal is moet de input beveiligd en gevalideerd worden, moet gepubliceerde data verwijderd worden en moet goede backup-software in gebruik zijn die ook toeziet op de toegang tot die gegevens. Deze praktische zaken helpen bij het bouwen en behouden van integriteit en zorgen ervoor dat bedrijfsgegevens te allen tijde valide en betrouwbaar zijn.

 

Door Edwin Weijdema, Global Technologist Product Strategy van Veeam Software

Reactie toevoegen