Management

Dit is een bijdrage van Rubrik
Analytics
The data goldmine

De data-goudmijn: hoe je het meest uit je data haalt

Denk eens terug aan die eerste slok koffie van vanochtend. Wat deed je? Checkte je het weer op Google?

21 februari 2019
Door: Rubrik, partner

Denk eens terug aan die eerste slok koffie van vanochtend. Wat deed je? Checkte je het weer op Google?

Stuurde je een felicitatie via Facebook (en keek je daarna vijf kattenvideo’s omdat je er toch was)? Wat je ochtendritueel ook is, het is bijna een gegeven dat je begon met data creëren vanaf het moment dat je je ogen opende.

En je bent niet de enige. Of het nou de 40,000 zoekopdrachten per seconde op Google is of de 300 uur aan video die iedere minuut naar YouTube wordt opgeladen, het is niet verwonderlijk dat 90 procent van de wereldwijde data in de afgelopen twee jaar werd gegenereerd.

Dat is allemaal voor je op kantoor aankwam en het echte genereren van data begon.

Data, data, overal
Er worden in het huidige tempo elke dag 2,5 quintiljoen bytes aan gegevens geproduceerd. Deze gegevens zijn bovendien meer verspreid dan ooit tevoren. Ze worden op verschillende locaties gegenereerd, zoals datacenters, de openbare cloud of kantoren. Vanwege de enorme hoeveelheid wordt het ook steeds moeilijker om deze gegevens te verplaatsen en de gegevens die je nodig hebt te herstellen.

Voor sommigen is de uitdaging om de kloof tussen de bestaande data-eilanden te overbruggen al groot genoeg. Jammer genoeg is het creëren van een samengevoegd systeem dat als één enkele bron van alle data fungeert, de cruciale eerste stap voordat je er meer interessante dingen mee kunt gaan doen.

Simpelweg gegevens beheren volstaat niet meer. Als bedrijven willen overleven en succesvol willen zijn, hebben ze clouddata-intelligentie nodig.

Geloof je me niet? Vraag het enkele van de meest succesvolle bedrijven. Vorig jaar noemde the Economist data 's werelds meest waardevolle hulpbron, waarmee zelfs olie werd ingehaald. En net zoals degenen die in vroeger tijden naar olie boorden een troef in handen hadden, lopen degenen die in hun gegevens boren en ze niet simpelweg 'opslaan', vandaag de dag voorop.

Organisaties als Amazon, Apple, Google en Microsoft zijn hun concurrentie een stap voor omdat ze de waarde in hun gegevens herkennen en benutten voor een serieus concurrentievoordeel. Het spreekt voor zich dat het op deze manier gebruiken van gegevens altijd op een verantwoorde manier en met instemming van mensen moet gebeuren. Zoals het Cambridge Analytica-schandaal heeft bewezen, kan het vertrouwen van mensen in merken zeer gemakkelijk verdwijnen wanneer vals spel aan het licht komt. Dat gezegd hebbende, zullen degenen die de beschikbare data niet gebruiken hun voorsprong en hun klanten verliezen aan de concurrentie.

Meta worden over data
Maar zelfs als je voorop loopt, is het boren in je data een veeleisende taak om alleen te ondernemen. Je moet je data echt begrijpen als je het effectief wil gaan gebruiken. Wat je nodig hebt, is data voor je data.

Metadata is een set gegevens die informatie over de eigenlijke data bevat, zoals waar deze is opgeslagen of door welke toepassing deze is gemaakt. Door een platform voor cloudgegevensbeheer te gebruiken dat standaard metadata aanmaakt, kunnen bedrijven hun gegevens op schaal beheren en analyseren.

En dat is niet alles wat je ermee kunt doen. Beslissingen kunnen geautomatiseerd worden met algoritmen, machinaal leren stelt een bedrijf in staat om gedragsregels vast te stellen en afwijkingen te identificeren, en kunstmatige intelligentie zorgt ervoor dat het na verloop van tijd slimmer wordt. Cruciaal is dat een robuust en veilig platform voor cloudgegevensbeheer al het bovenstaande op de achtergrond doet.

Gegevensbeheer
Het resultaat? Het meest voor de hand liggende en onmiddellijke effect is de mogelijkheid om de manier waarop gegevens worden beheerd radicaal te verbeteren, waardoor efficiënter kan worden opgeslagen. Het kan ervoor zorgen dat de gegevens zich precies bevinden op de plaats waar deze zich zou moeten bevinden. Heb je gevoelige data, zoals creditcardinformatie? Je kunt beleidsregels instellen om het systeem zo te automatiseren dat gevoelige datasets altijd op locatie worden bewaard en niet naar de openbare cloud kunnen worden verplaatst.

Als je begrijpt met welke toepassingen je gegevens worden gemaakt, kun je ze dienovereenkomstig behandelen. Door vergelijkbare gegevenstypen te groeperen, b.v. databases versus bestandsservers, kun je deze gegevens intelligenter en goedkoper dedupliceren en op een wereldwijde schaal opslaan.

Historisch gezien omvatte dit proces het handmatig poolen van databronkanalen, het dumpen van de gegevens in een gedeelde opslaglocatie en vervolgens het doorzoeken van de gegevens om duplicaten te identificeren of overeenkomsten in de gegevens te vinden. Metadata doet dit (en meer) efficiënt, intelligent en onafhankelijk en helpt je bij het inzetten van minder dure opslagruimte.

Gegevens van de rand halen
Een andere groeiende databron wordt geleverd door IoT-apparaten. Op fabrieksvloeren genereren machinesensors aanzienlijke hoeveelheden data: te veel om eenvoudig te beheren. Je hebt een manier nodig om deze gegevens aan de rand van het netwerk te verwerken of om ze efficiënt over te brengen naar een meer centraal punt om het daar te verwerken. Metadata maakt dit mogelijk, waardoor het verplaatsen van gegevens van de rand naar de proceslocatie snel en efficiënt wordt, omdat de gegevens onmiddellijk herkenbaar en beheersbaar zijn.

IoT-apparaten zijn niet de enigen die data aan de rand creëren. Meer en meer data wordt op afstand gemaakt en als gevolg daarvan is het voor organisaties moeilijk om die data op intelligente wijze te verplaatsen, vooral wanneer er haast bij geboden is. Tijdens het racen moet Mercedes-AMG Petronas Motorsport, een klant van ons, de gegevens van zijn auto op de baan efficiënt terugzetten naar de analysehulpmiddelen en weer terug met een snelheid van 1,9 GB per seconde, zonder compromis. Dankzij metadata zijn deze kritieke gegevens gecatalogiseerd en onmiddellijk toegankelijk, waardoor gegevens efficiënt kunnen worden verplaatst naar locaties waar het Formule 1-team ze nodig heeft.

Databescherming
En natuurlijk zou het geen volwaardig gesprek over data zijn zonder regelgeving te noemen. Met metadata worden gegevens geïndexeerd, waardoor het recht om te worden vergeten gemakkelijker wordt. Je kunt eenvoudig alle klantgegevens in je hele organisatie vinden en ervoor zorgen dat deze onmiddellijk worden verwijderd. Het gebruik van metadata in deze hoedanigheid snel groeien, aangezien regelgeving in de toekomst steeds belangrijker wordt.

Vanuit beveiligingsoogpunt maakt metadata het eenvoudiger om ransomware-aanvallen te identificeren en ervan te herstellen. Door de gegevens te bewaken en een basislijn van gedrag vast te stellen, kun je elke plotselinge verandering of anomalie identificeren. Bij het zien van die verandering - b.v. bepaalde bestanden worden plotseling verwijderd of gemanipuleerd - kunnen bedrijven dan precies vaststellen welke gegevens zijn getroffen. Van daaruit is het gemakkelijk om terug te keren naar de laatst bekende set van veilige, onaangetaste gegevens met een paar klikken.

Vroeger zou dit een handmatige en arbeidsintensieve taak zijn geweest, waarbij elk individueel stukje data moest worden doorzocht om vast te stellen of het was aangetast, en het eventueel te vervangen met oudere versies, om maar te zwijgen van de kans op menselijke fouten. Dankzij metadata is dit proces volledig geautomatiseerd.

Van governance tot beveiliging, niets van het bovenstaande is mogelijk zonder metadata, en het bespaart een serieuze hoeveelheid handwerk, tijd en geld - middelen die niet in overvloed aanwezig zijn in de bedrijven waar ik mee heb gewerkt!

Onze sector kijkt altijd naar de toekomst, naar de volgende disruptieve technologie, maar is ook schuldig aan het negeren van wat er nodig is om ons daar te krijgen. Tim Berners-Lee theoretiseerde dat “gegevens kostbaar zijn en langer zullen meegaan dan de systemen zelf”. Ik ben het met hem eens: niet alleen zal de data de systemen van vandaag en morgen overleven, het zal ook de vitale levensader zijn die hen van energie zal voorzien. Hoe eerder bedrijven dit erkennen, hoe sneller ze hun gegevens kunnen gebruiken om naar binnen te kijken en elk aspect van hun organisatie radicaal te versterken.

Reactie toevoegen