Management

Analytics
Analytics: snel inzicht in de heterogene databerg

Analytics: snel inzicht in de heterogene databerg

Data scientists zijn niet meer nodig voor een gedetailleerd inzicht in bedrijfsdata. We trekken zelf conclusies over kansen en risico’s die eerder onopgemerkt bleven. Nog even en het algoritme doet dat voor ons.

2 januari 2018

Data scientists zijn niet meer nodig voor een gedetailleerd inzicht in bedrijfsdata. We trekken zelf conclusies over kansen en risico’s die eerder onopgemerkt bleven. Nog even en het algoritme doet dat voor ons.

Geen business zonder data. En geen succes zonder data-analyse. Voor veel organisaties zijn analytics nog geen gesneden koek. Ze weten niet half welke gegevens hun ter beschikking staan en hoe ze deze inzetten voor maximaal voordeel.

Hoe behaal je succes met behulp van de analyse van big data? Dat wordt niet enkel bepaald door de enorme datavolumes waaruit je kunt putten. Minstens zo relevant zijn de koppeling van uiteenlopende datatypes, de kwaliteitsbewaking en de uiteindelijke waarde voor de business.

Heterogene data

Wellicht de grootste uitdaging voor analytics is de toenemende heterogeniteit van de beschikbare data. Gestructureerde gegevens uit klant-, product- en order-databases worden afgewisseld met een groeiend aantal ongestructureerde bronnen: click streams, logfiles, social media feeds, sensor-data en ga zo maar door. Veeg alles op een hoop en je hebt een data lake.

Veel organisaties kiezen voor het aanbrengen van enige structuur in de heterogene gegevens. Daarbij komen de data via een ETL-proces (extract, transform, load) terecht in een datawarehouse. Van daaruit zijn ze beschikbaar voor data-integratie en analyse. ETL is echter relatief tijdrovend en tegenwoordig dus minder geschikt.

Sneller!

Tijd is geld en versnelling van het analytics-proces is de volgende uitdaging. De toenemende wens van real-time analytics, bijvoorbeeld voor executive dashboards met actuele KPI-standen, vereist een zo klein mogelijke vertraging en krachtige ‘number crunching’. Te veel latency is namelijk fnuikend voor een goede gebruikerservaring. Om die reden leunen organisaties niet meer alleen op ETL. Ze zetten in op een palet van data-integratieprocessen, waaronder replicatie, datavirtualisatie en datafederatie.

Ook het gebruik van NoSQL-databases leidt tot snellere analyse van grote hoeveelheden data van uiteenlopend formaat. Traditionele relationele databases weten geen raad met de data-explosie en lopen al vlug tegen de grenzen van de schaalbaarheid aan.

Datakwaliteit

Zelfs als je het analyticsproces op orde hebt, betekent dit niet automatisch succes. Ga er maar vanuit dat de databronnen veel onbetrouwbare gegevens bevatten, dark data. Onjuiste, onvolledige, dubbele en nietszeggende data die je niet zonder meer kunt inzetten bij analytics. Dergelijke datavervuiling zou jaarlijks ongeveer 600 miljard dollar kosten.

De oplossing ligt in collaborative data governance, waarbij iedereen in een organisatie samenwerkt aan schone, veilige en accurate data. Medewerkers worden zelf verantwoordelijk voor de correctie, kwalificatie en opschoning van de data waarvan zij het meeste verstand hebben. Wat hierbij kan helpen, is het aanbrengen van een datafilter tussen inkomende informatiestromen, organisatie en medewerkers. De filter analyseert en classificeert de data op relevantie, correctheid en mogelijkheid tot verwerking. Dit verkleint de vervuiling en vergroot de mogelijkheid om tot dusver ongebruikte dark data in te zetten.

Self-service

Het gebruik van analytics tools is de afgelopen jaren flink veranderd. Jarenlang werd het aanbod gedomineerd door toepassingen waarmee statistici en data-analisten bedrijfsdata analyseerden en rapporten samenstelden voor de rest van de organisatie.

Tegenwoordig is het self-service BI dat de klok slaat. Het zijn nieuwe tools die doorsnee gebruikers zonder statistische kennis kunnen inzetten voor ad hoc analyses, al dan niet aan de hand van vooraf door IT gedefinieerde datamodellen. Self-service BI heeft twee grote voordelen. De business profiteert van snellere inzichten en de IT-afdeling wordt minder belast met analyseverzoeken.

Artificial Intelligence

Wat ook is veranderd, is de wijze waarop toepassingen meedenken met de gebruiker. Zo is de overtreffende trap van analytics artificial intelligence (AI) systemen die gedrag kunnen veranderen op basis van verzamelde gegevens, gebruiksanalyse en andere observaties. Met kunstmatige intelligentie worden zulke grote stappen gemaakt, dat organisaties nu al data kunnen inzetten ter voorbereiding op nieuwe situaties en oplossing van problemen waarmee nog niemand eerder was geconfronteerd.

Artificiële intelligentie beperkt zich niet tot chatbots voor geautomatiseerd klantcontact. Steeds meer organisaties zetten algoritmes in voor het geautomatiseerd ontwikkelen en testen van software, voor voorspellingen (predictive analytics) en voor herkenning van eerder onopgemerkte dwarsverbanden, risico’s en mogelijkheden. De eerste stappen zijn gezet, maar marktanalisten verwachten dat het nog tot ongeveer 2025 duurt voordat AI de beloftes waarmaakt. Tot die tijd zullen zelfs de basisvoordelen zich niet automatisch materialiseren, waarschuwen ze. Met soft skills kunnen IT-professionals wel bijdragen aan succesvolle AI-projecten.

De praktijk

Hoewel data analytics nog in de kinderschoenen staat, wordt de technologie in diverse sectoren al volop ingezet. De onderstaande zes toepassingen tonen waartoe analytics nu en in de toekomst in staat is.

  1. Het datalab van Rijkswaterstaat analyseert IoT-data en stroomlijnt bedrijfsprocessen
  2. Predictive analytics in de Nederlandse logistieksector, bijvoorbeeld voor het voorspellen van de vraag naar levensmiddelen
  3. ProRail test een systeem dat verzakkingen met data-analyse in kaart brengt en voorkomt daarmee verstoringen op het spoor
  4. Drinkwaterbedrijf Oasen gebruikt machine learning voor tijdige vervanging van waterleidingen
  5. Olie- en gasindustrie zet big data analytics in voor de dagelijkse productie en voor besluitvoering over boringen en exploratie
  6. Analyse van miljarden datapunten toont gevaarlijke combinaties van medicijnen
Lees meer over
Lees meer over Management OP AG Intelligence
Reactie toevoegen
De inhoud van dit veld is privé en zal niet openbaar worden gemaakt.