Innovatie & Strategie

Cloud
big data

Supercomputer-as-a-Service geen panacee voor bigdata-problemen

Datascientist moet techniek wel in gereedschapskoffer hebben.

© Shutterstock BsWei
31 januari 2022

Datascientist moet techniek wel in gereedschapskoffer hebben.

De problemen die organisaties hebben met echt toegevoegde waarde halen uit hun bigdatastrategie, zitten niet in de verwerkingskracht, maar eerder in het op orde krijgen van de dataverzameling.

Dat denkt Daan Kolkman in ieder geval. Hij is programmamanager Responsible Artificial Intelligence aan de Hogeschool Utrecht, mede-initiatiefnemer van het MKB Datalab van de Jheronimus Academy of Data Science (JADS) en ondernemer. Recent suggereerde Venturebeat dat met name kleinere bedrijven hun voordeel kunnen doen met het High Preformance Computing (HPC)-aanbod dat de meeste grote cloudaanbieders tegenwoordig hebben. Het argument was dat organisaties aangeven dat ze maar een klein deel van de verzamelde gegevens daadwerkelijk gebruiken (12%) en dat werknemers niet op tijd de benodigde inzichten kunnen krijgen (63%). HPC-as-a-Service - zeg maar een supercomputer in de cloud - zou hier uitkomst kunnen bieden. Maar kleinere bedrijven zien zichzelf onterecht niet als doelgroep voor deze dienst, concludeerde Venturebeat.

Kolkman denkt echter niet dat daar het probleem zit. Belangrijker is het goed inrichten van de data-huishouding. "Daarmee bedoel ik bijvoorbeeld het op orde brengen van de datakwaliteit en de systemen waarmee die data beschikbaar gemaakt worden. Als dat al goed geregeld is, blijkt het vaak ook nog lastig om systemen te bedenken die goed aansluiten bij de manier waarop nu beslissingen worden genomen, of de manier waarop beslissingen genomen worden te veranderen."

Opschalen is een optie

Wanneer dat probleem is opgelost kan het MKB doorgaans prima uit de voeten met hulpmiddelen die hen nu ter beschikking staan. Maar dat neemt niet weg dat iedere datascientist en IT-ontwikkelaar op de hoogte moet zijn van het bestaan van mogelijkheden om op te schalen naar nieuwe technologie die in de cloud wordt aangeboden, vindt Kolkman.

Hij noemt zelf een voorbeeld waarbij het MKB Datalab van JADS het verkeerskundig ICT-bureau VIA Software heeft geholpen met de inzet van HPC-as-a-Service om algoritmen die een diepgaande analyse van verkeersongevallen maakten, te kunnen gebruiken. Het doel was de verkeersveiligheid per gemeente in kaart te brengen. Maar bij elk ongeval speelt een groot aantal parameters een rol. Denk daarbij onder meer aan het aantal betrokken voertuigen, het tijdstip van de dag, het wegtype en de weersomstandigheden. Het is daardoor lastig een goed overzicht te geven van de situatie in een bepaald gebied.

"Het draaien van dit algoritme was dermate tijdrovend dat ervoor gekozen is om dit in de cloud te trainen en via een API te ontsluiten", zegt Kolkman. "Ik denk dat het nuttig is om te weten hoe je dergelijke technieken inzet. Het is - zoals wel vaker - geen doel op zich."

Reactie toevoegen
De inhoud van dit veld is privé en zal niet openbaar worden gemaakt.