Management

Cloud
Het internet van alles

5 vragen over Analytics for IoT van SAS

Schaalbare cloud-architectuur maakt analytics toegankelijk voor elke gebruiker.

Het internet van alles © CC0 Public Domain,  kropekk_pl
6 mei 2016

Wat is er bijzonder aan de data uit het Internet of Things, dat daar een speciale analysemodule voor ontwikkeld moet worden? Het is toch gewoon Big Data? Rein Mertens, teamleider Business Analytics Pre-Sales en Data Scientists van SAS Nederland: “Het is inderdaad Big Data, maar er is iets bijzonders mee aan de hand. Uit metingen blijkt namelijk dat de doorsnee gebruiker maar 20 procent van alle IoT-data gebruikt. De overige 80 procent verdwijnt geheel buiten beeld. Het is denkbaar dat in die 80 procent nog gegevens zitten waar een bedrijf wat mee kan doen. Een oplossing is om de overgebleven data op te slaan, maar als dat niet lukt dan kun je het probleem misschien van de andere kant benaderen, door gebruik te ­maken van een techniek die ESP wordt genoemd.”

Wat kunnen we ons bij ESP voorstellen?
Edwin Peters, marketingdirecteur SAS: “ESP staat voor Event Stream Processing. Het betekent dat je de gegevens analyseert op het moment dat ze als stream het bedrijf binnenkomen. Via ESP zou je bijvoorbeeld een slimme filtering kunnen doorvoeren, waarna je alleen gegevens overhoudt waar je echt iets mee kunt doen. Het kaf van het koren scheiden, bij wijze van spreken. Of je kunt de techniek gebruiken om een pre-analyse op de datastroom uit te voeren, waarbij je de data in verschillende categorieën kunt indelen. Dat is handig voor latere analyse. Natuurlijk zijn er ook bedrijven die een directe koppeling leggen tussen ESP en het filesysteem van Hadoop, zodat alle binnenkomende data opgeslagen worden. Deze grote hoeveelheid opgeslagen gegevens kun je gebruiken om patronen te herkennen, om daar vervolgens een (statistisch) model op te ontwikkelen. Aan de hand van dat model kun je de binnenstromende gegevens snel en grondig analyseren, zodat je informatie krijgt om beter zaken te kunnen doen.”

Dat klinkt goed. Is het een kwestie van even een analyse draaien en dan met dat model verder werken?
Mertens: “Nee, zo eenvoudig is het niet. Je moet het goed in de gaten blijven houden, want binnenstromende gegevens kunnen ook veranderen. Zeker in een IoT-omgeving, waar binnen korte tijd een nieuwe reeks sensoren bijgeplaatst kan worden. Je krijgt dan te maken met nieuwe datastromen die je ook een plaats zult moeten geven. Je moet het model steeds blijven toetsen aan de datastromen. Als de datastromen veranderen, neemt de effectiviteit van het model af. Dat kun je meten; als de afwijking te groot wordt, moet je het model aanpassen.

Via een model kun je bepalen welke klanten het eerst geneigd zijn om met die dienst te stoppen

Er zijn technieken om te kijken hoe een model presteert en een data scientist kan een grenswaarde stellen. Wordt die overschreden, dan moet je in actie komen en wel gericht. Via software kun je het model beheersen zonder dat je een aantal FTE’s hebt rondlopen. Het model zorgt voor betere resultaten, doordat gerichter naar data wordt gezocht.

Een voorbeeld: je weet dat 10 procent van de klanten wil stoppen met een bepaalde dienst. Je kunt dan willekeurig één op de tien klanten ­benaderen met een speciaal aanbod. Via een model kun je bepalen welke klanten het eerst geneigd zijn om met die dienst te stoppen. Benader je juist die groep met je speciale aanbod, dan heb je meer succes.”

Een analytische cloud lijkt een uitkomst voor de data scientist. Hij kan naar believen resources ­bijbestellen zodat de ­code optimaal loopt. Zijn daar voorzieningen voor?
Mertens: “Jawel, maar anders dan je zou denken. Het klinkt de data scientist misschien gek in de oren, maar we proberen om gebruikers niet onnodig te laten coderen. In plaats daarvan biedt de cloud-omgeving een reeks API’s, waarmee je de functionaliteit direct kunt aanroepen vanuit een andere omgeving. Je kunt de SAS-cloud dus aanroepen vanuit een bestaand script, de codeerwerkzaamheden worden zo tot een minimum beperkt. Het zal best wat moeite kosten om de geavanceerde gebruikers te overtuigen van de nieuwe mogelijkheden. Meestal hangen ze de stelling ‘coding is the new cool’ aan, en ze zullen daar een beetje van moeten worden afgebracht.”

Hoe weten de gebruikers dat de API’s er zijn en ­waarvoor ze gebruikt kunnen worden?
Peters: “We zullen het moeten uitleggen, onder andere door het publiceren van de API’s. Zo kunnen we vertellen welke API’s er zijn en welke functionaliteit een gebruiker mag verwachten. Het opstellen van dergelijke publicaties kost tijd. Viya is net gelanceerd, waardoor momenteel nog niet alle documentatie is gepubliceerd. Daarnaast zullen we de komende periode demo’s geven bijvoorbeeld in het kader van AaaS, ofwel Analytics-as-a-Service. Populair gezegd trek je dan je analyses uit de muur, ideaal voor wat Gartner de Citizen Data Scientist (CDS) pleegt te noemen. De CDS is iemand met een hoop materiekennis van de onderneming en daarnaast belangstelling voor analyses. Via AaaS kunnen zij snel slimme analyses opzetten, waarmee ze zelf uit bedrijfs­gegevens waardevolle informatie kunnen halen."

 
Lees het hele artikel
Je kunt dit artikel lezen nadat je bent ingelogd. Ben je nieuw bij AG Connect, registreer je dan gratis!

Registreren

  • Direct toegang tot AGConnect.nl
  • Dagelijks een AGConnect nieuwsbrief
  • 30 dagen onbeperkte toegang tot AGConnect.nl

Ben je abonnee, maar heb je nog geen account? Neem contact met ons op!