Innovatie & Strategie

Datamanagement
hooiberg

Snelgroeier: IT’ers bevrijden van dataclassificatie

Collibra is uit op ‘Amazonificering’ voor data.

© CC0 - Pixabay Luca Huter
9 september 2019

Collibra is uit op ‘Amazonificering’ voor data.

Belgisch bedrijf voor data governance was eerst zo’n vier jaar te vroeg, vertelt medeoprichter en CEO Felix van de Maele. Toen, in 2008, waren banken wel geïnteresseerd om de herkomst van hun data te kunnen aantonen aan toezichthouders. Nu is alles en iedereen bezig met data: vergaren, koppelen, doorspitten, vertrouwen en verzilveren. Is er een industrie die niet in beeld is bij Collibra? “Nee.”

De topman van Collibra is vlak voor de zomervakantie benoemd tot EY Ondernemer van het Jaar in New York. New York? Maar Collibra is toch Belgisch? Klopt, maar zoals Van de Maele al veel eerder heeft gezegd: een softwarebedrijf bouw je in Amerika. De investering van 100 miljoen dollar begin dit jaar door Google speelt daar mogelijk ook een rol in. Het gaat daarbij niet alleen om geld, maar ook om intensieve samenwerking met de R&D-tak (research and development) van Google, vertelt Van de Maele aan AG Connect.

‘Het zit 'm in de data’

Hij noemt de Amerikaanse internetgigant onomwonden “een van de meest geavanceerde AI-bedrijven ter wereld”. En zoals experts weten te vertellen: het gaat bij kunstmatige intelligentie (AI) om de data die je het voert. Dit geldt voor AI en machine learning, maar ook voor cloudklanten. “Het zit 'm in de data”, bezweert Van de Maele.

Bijkomend probleem, zo weet hij, is dat veel datascientists de tools missen om hun werk en inzichten om te zetten in bruikbare zaken voor de businesskant van organisaties. “Google ziet die uitdaging en is dus intern naar zijn investeringstak gegaan”, om talent ‘in de buitenwereld’ te zoeken. De kapitaalinjectie van 100 miljoen door CapitalG, de investeringstak van Google, heeft de totale waarde van Collibra op 1 miljard dollar gebracht.

Niet slecht voor een bedrijf dat in 2008 is begonnen als spin-off van de universiteit Brussel. Het toen opgestarte Collibra richtte zich op semantic technology, waarbij de combinatie van mens en machine tot meerwaarde moest leiden; voor het toen nog esoterische toepassingsgebied van machine learning en AI, waar vooral wetenschappers zich mee bezighielden.

Als Amazon.com

Anno nu is het werkveld en ook de ambitie veel groter. Van de Maele heeft ‘Amazonificering’ voor data voor ogen. Collibra wil voor datagovernance doen wat e-commercereus Amazon heeft gedaan voor shopping: het zo toegankelijk mogelijk maken voor zo veel mogelijk mensen. Cruciaal bij datagebruik is de definiëring en daarbij draait het voor praktisch gebruik om wat de definitie is voor non-techmensen. Bijvoorbeeld: “Wie of wat is de klant?”

Van de Maele geeft dit ogenschijnlijk eenvoudige voorbeeld als kernvraag die nu hele sectoren bezighoudt. Collibra heeft het Vlaamse ministerie van Onderwijs als klant gekregen, vertelt hij, nadat de minister niet goed kon antwoorden op de vraag hoeveel studenten er zijn. Hetzelfde scenario kan gelden voor een CEO die vraagt hoeveel klanten zijn bedrijf nu eigenlijk heeft. “Er zijn dan vijftien verschillende antwoorden mogelijk.”

In vergelijking met 2008, toen de financiële sector voor Collibra de afzetmarkt was, spreekt Van de Maele nu dan ook van “een hele andere wereld”. In wezen is nu iedereen een potentiële klant voor deze snelgroeier uit België. Dat Google en Uber databedrijven zijn, daar is iedereen wel van doordrongen. Maar dat eigenlijk elke organisatie data-driven is – of anno 2019 wel zou moeten zijn – is niet alom bekend (of erkend).

IT’ers bevrijden

Praktisch probleem hierbij, wat Collibra belooft te tackelen, is dat het domein van data van oudsher is overgelaten aan de IT. De klassieke kloof tussen IT en business speelt daarbij beide partijen parten, ook voor data en de oh zo cruciale definiëring en classificatie daarvan. “Wij willen IT’ers bevrijden van dataclassificatie.” Enerzijds omdat het classificeren van data nou niet bepaald een IT-kerntaak is of zou moeten zijn. Anderzijds omdat de kennis van welke definities en classificeringen zinnig en zakelijk nuttig zijn vooral bij de business liggen.

In Collibra’s beginperiode waren de voornaamste concurrenten dan ook grote IT-leveranciers als IBM en SAP, memoreert Van de Maele, en die aanbieders brachten technisch gerichte oplossingen waarbij nogal wat handwerk vereist was. “Wij waren de eerste en de enige die software boden voor datagovernance”, in plaats van storagebeheerproducten waarmee eventueel na aanpassingswerk wat aan governance viel te doen.

Vertrouwen in data

De Europese databeschermingsrichtlijn AVG legt Collibra ook geen windeieren. De inmiddels in nationale wetten omgezette privacyrichtlijn verplicht bedrijven en organisaties om veel beter om te gaan met data. Dit omvat grip op data om uitlekken te voorkomen, maar ook inzicht in data om gericht aan dataverzoeken te kunnen gehoorzamen.

“Uiteindelijk gaat het om vertrouwen in je data. Voor toezichthouders, maar ook voor de business.” En uiteindelijk ook voor de klant, in diens vele vormen en hoedanigheden. De belofte van big data heeft bedrijven en organisaties jarenlang verleid om maar meer en meer data te vergaren. Het is echter een misvatting om te denken dat ‘veel data’ automatisch gelijkstaat aan ‘veel waarde’.

De 4e (en 5e) V

“Meer waarde uit je data is niet een kwestie van de grootte en de snelheid van je database”, haalt Van de Maele twee van de bekende vier V’s van big data aan. Naast volume en velocity gaat het ook om variety en veracity. Terwijl deze onderbouwing voor big data oorspronkelijk neerkwam op drie V’s (van omvang, snelheid en variëteit), is de vierde V (van waarheidsgetrouwheid) een waardevolle aanvulling. Tegenwoordig wordt er soms nog een vijfde V aan toegevoegd: van value.

Zowel de vierde als ook de vijfde V komen voort uit goede governance van de data: zijn de gegevens correct en puur, en dus te vertrouwen? Deze vraag kan nog prangender zijn als er datasets in huis worden gehaald van derde partijen. “Is je data niet skweded [scheefgetrokken, door aannames en onjuistheden - red.]?”, stelt Van de Maele de kernzaak aan de kaak.

Het belang hiervan wordt onderstreept door de praktijk van datagedreven initiatieven en AI-projecten die tot onvoorziene en ongewenste uitkomsten komen, simpelweg omdat de gebruikte data ingebouwde – en mogelijk niet erkende – vooroordelen (bias) bleek te bevatten. Organisaties hebben hierbij een verantwoordelijkheid, stelt de medeoprichter en CEO van Collibra.

Inmiddels telt het Belgische bedrijf naast financiële instellingen een breed scala aan klanten: uiteenlopend van retailers en telecombedrijven, via vrachtvervoerders en assetmanagers, tot overheden en onderwijsinstanties. Assetmanagers zijn bijvoorbeeld bezig met het kopen en verkopen van datasets. En overheden kampen met data-uitdagingen zoals het interdepartementaal delen van gegevens, vertelt Van de Maele. Over universiteiten legt hij uit dat die bijvoorbeeld onlinestudies aanbieden maar nog subsidies krijgen op basis van het aantal afgestudeerde studenten.

Je datasets begríjpen

Big data is de kunst om de naald in de hooiberg te vinden. Van de Maele relativeert: “De hooiberg is groter, maar de naald is nog van gelijke omvang.” Belooft big data dan niet dat er meer naalden zijn te vinden, in die grotere hooiberg? Van de Maele reageert bedachtzaam: “Nou, je moet je datasets begríjpen; de inhoud ervan.” Om in te zien welke klanten bijvoorbeeld Amerikaans zijn en welke Europees, om dan elke groep op gepaste (en AVG-proof) wijze te kunnen bedienen.

Genoeg groeimogelijkheden in het vooruitzicht dus voor Collibra. En Van de Maele is vastberaden daarop in te springen. De plannen voor de nabije toekomst zijn: “Ons productplatform uitbouwen. Snel blíjven groeien.” Collibra is toch inmiddels van serieuze omvang? Van de Maele werpt tegen: “Alles is relatief: de markt is zó groot.”

Bedrijf: Collibra

Gevestigd in: Brussel

Doet: datagovernance, data intelligence

Medewerkers: 350 (september 2018, met als doel 650 werknemers eind 2019)

Financiën: 1 miljard dollar waard, op basis van 100 miljoen euro investering door CapitalG

Bestaat sinds: 2008

Magazine AG Connect

Dit artikel is ook gepubliceerd in het magazine van AG Connect (augustusnummer 2019). Wil je alle artikelen uit dit nummer lezen, klik dan hier voor de inhoudsopgave.

Lees meer over Innovatie & Strategie OP AG Intelligence
Reactie toevoegen
De inhoud van dit veld is privé en zal niet openbaar worden gemaakt.