Innovatie & Strategie

Analytics
Big data

Domeinkennis cruciaal voor datascientist

© CC0 - Pixabay
20 september 2013

 

Analytics, de discipline die zich bezighoudt met informatievergaring uit grote hoeveelheden data, is sterk bepalend voor de ICT-business. In toenemende mate bewijst Analytics haar waarde in de logistieke sector, in de energiemarkt, in het domein van de publieke veiligheid én in de gezondheidszorg. Met behulp van geavanceerde analyse- en dataminingtechnieken kan er informatie over bedrijfsprocessen en klantgedrag uit de data worden vergaard en kunnen er voorspellende modellen uit de data worden gedestilleerd.

Een kenmerkende en veelbesproken rol in het veld van Analytics is de rol van de datascientist, de expert op het snijvlak van business- en data-analyse. De datascientist is iemand die weet welke businessproblematiek er speelt, en bovendien in staat is om er samen met programmeurs en analisten oplossingen voor te realiseren. De datascientist weet verschillende databronnen te combineren, te analyseren en, waar nodig, te verrijken om er uiteindelijk de gevraagde informatie uit te halen. Daarbij gaat hij geavanceerde technieken, op het gebied van machine learning of op het vlak van grote hoeveelheden getallen (number crunching), niet uit de weg. De datascientist biedt dankzij zijn communicatieve brugfunctie tussen businessanalisten, statistici en technische experts businesswaarde voor veel organisaties.

Bovendien is de datascientist van toenemende waarde op het gebied van sales en acquisitie. Projecten worden tegenwoordig namelijk niet langer alleen door salesvertegenwoordigers binnengehaald. Het zijn steeds vaker de inhoudelijk betrokken medewerkers die voor continuïteit in de business zorgen. Daarbij worden ze gefaciliteerd door het sales- en accountmanagement. De verschuiving in deze rol wordt mede veroorzaakt door de invloed van communities (zie kader). De datascientist is degene die de dialoog met bestaande en nieuwe klanten aangaat om ze te overtuigen dat hun probleem écht begrepen wordt en hoe de oplossing er in hoofdlijnen uit moet zien. Voor de datascientist zijn er voor nu en de komende jaren dus genoeg carrièrekansen.

 

Minder techniek

Maar, let op, er moet een kanttekening worden geplaatst. Zoals gezegd is de rol van de datascientist een rol waarin de brugfunctie tussen een specifiek domein en technische (data-)analysetechnieken wordt benadrukt. Een zeer waardevolle en vooralsnog schaarse functie waar de jonge ICT’er in spe gericht, en met glorieuze toekomstverwachtingen, voor kan worden opgeleid. Echter, in het algemeen zien we dat de rol van de ICT met haar producten en dienstverlening niet langer leidend is dankzij de techniek. Weliswaar is de ICT-sector van oudsher bedoeld om te faciliteren door processen te automatiseren, maar nu de technieken inmiddels commodity zijn geworden, zijn de diensten niet langer gewild vanwege de techniek. De crux zit tegenwoordig in de aansluiting met het domein. Dit betekent dat het accent van de datascientist meer op zijn domeinkennis komt te liggen en minder op zijn analysetechnieken en ICT-expertise.

Een voorbeeld in het domein van de publieke veiligheid is de analyse van inbraken, mishandelingen en andere verstoringen van de openbare orde. De datascientist heeft kennis van het domein, bijvoorbeeld de modus operandi, en weet daarnaast goed welke technieken er nodig zijn om relaties te vinden en voorspellende modellen te creëren. Een ander voorbeeld vinden we in de gezondheidszorg. De analyse van medische data levert aanzienlijke verbeteringen in de zorg op (zie onder). De ervaring leert dat domeinkennis in beide voorbeelden cruciaal is voor het kunnen maken van goede analyses.

De verhouding tussen de hoeveelheid domeinkennis en de hoeveelheid ICT-kennis verandert: waar voorheen een ICT-expert zijn technische waarde wist uit te breiden met domeinkennis, is het tegenwoordig vaker andersom: we zien een domeinexpert die zijn waarde vergroot door middel van een beetje ICT-kennis. In dit beeld is de moderne datascientist dus iemand die vanuit een bepaald domein zich op zeer toepassingsgerichte wijze bekwaamt in analyse- en dataminingtechnieken.

Voorlopig dus meer domein en minder techniek. Dit laat natuurlijk onverlet dat in de toekomst wellicht weer een ommekeer kan ontstaan waarbij de kennis van domeinexperts zich manifesteert in nóg slimmere data-analysesoftware, die vervolgens weer door techneuten moet worden onderhouden en vervolmaakt. Een typisch voorbeeld van evolutie die door golfbewegingen en intensieve samenwerking tussen mens en machine zorgt voor telkens weer betere en geavanceerdere oplossingen.

Communities

Waar voorheen de salesmedewerker heer en meester in was, is het tegenwoordig de datascientist die zorgt voor continuïteit in de dienstverlening. De waarde van salesmedewerkers en accountmanagers verschuift daarmee naar een wat meer faciliterende rol.

Een mogelijke oorzaak voor deze verschuiving is de trend van communityvorming: kennisdeling vindt niet langer plaats vanuit een enkele organisatie, maar juist in netwerken bestaande uit individuen die zich organiseren rond een gemeenschappelijke expertise of kennis. Naast technische kennisdeling wordt in dit soort communities tevens het businessnetwerk onderhouden. Hierdoor hebben de inhoudelijke experts samen met hun eigen klantrelaties en -ervaring vaak meer invloed op vervolgopdrachten dan de louter met factsheets bewapende salescollega’s.

Overigens heeft zich de trend van communities de afgelopen jaren flink doorgezet. De invloed is daardoor nu ook strategisch waarneembaar: vroeger bepaalde het bedrijf, de organisatie of het instituut zelf zijn koers en richting, tegenwoordig ligt die invloed meer en meer bij individuele werknemers. Ervaring leert dat jonge mensen, bijvoorbeeld schoolverlaters, zich steeds minder laten beïnvloeden door een organisatie pur sang, zij laten zich beïnvloeden op een indirecte manier: alleen als een organisatie ergens voor staat, een community omarmt of zich specialiseert in een bepaald domein dat aansluit bij de interesse en expertise van de werknemer, dan is er interesse van de werknemer om er te werken. Op een dergelijke wijze manifesteert de invloed van communities zich, via de werknemers, op de strategie van individuele bedrijven.

Moderne data-analyse

Het verzamelen van medische gegevens over patiënten en hun behandeltrajecten is inmiddels een vanzelfsprekendheid binnen de zorg. De nieuwe generatie EPD-software maakt zelfs gebruik van Clinical Decision Support, een systeem dat vergelijkingen maakt en zorgverleners ondersteunt in hun behandeladviezen.

Gegevens uit ziekenhuis-informatiesystemen en elektronische patiëntendossiers worden echter nog lang niet in hun volle omvang benut. Door op groepsniveau naar de data te kijken kunnen er trends en verbanden worden gevonden waarmee (voorspellende) classificatiemodellen kunnen worden gemaakt.

Het toepassen van geavanceerde analyse kan leiden tot effectievere medicatie, minder bijwerkingen en kortere behandeltrajecten. Te lange behandeltrajecten zijn financieel gezien erg nadelig en bovendien heel vervelend voor de patiënt: de behandeling slaat niet of onvoldoende aan en herstel laat op zich wachten.

Het nut van geavanceerde data-analyse dient zich vooral aan voor ziekten die geen enkelvoudige oorzaak hebben, zoals bijvoorbeeld obesitas, diabetes en kanker. De verschijnselen ontstaan vaak door een samenspel van omgevingsfactoren, gedrag en genetische factoren. Koren op de molen voor de rol van de moderne datascientist.

Farmaceutische bedrijven zijn continu bezig te kijken naar het effect van hun medicijnen. Wanneer er een nieuw medicijn wordt ontwikkeld, wordt er op grote schaal analyse gedaan naar het effect en eventuele bijwerkingen. Het bedrijf Emotional Brain (www.emotionalbrain.nl) in Almere doet dit bijvoorbeeld voor medicijnen die ingrijpen op complexe psychische of hormonale processen.

Eenmaal in de markt gaat het vervolgens om het optimaliseren van de samenstelling of het reduceren van bijwerkingen. Het is namelijk lang niet altijd duidelijk waarom een medicijnsamenstelling (een cocktail) voor de ene patiënt wél en voor de andere niet werkt. Voorspellende modellen bewijzen hun nut in het geval van bijvoorbeeld het HIV, dat telkens muteert, waardoor een bepaalde cocktail niet langer werkt. Daarop moet worden geanticipeerd. Hiervoor zijn zeer geavanceerde analyse- en modelleringstechnieken vereist. Het Alan Turing Institute Almere (ATIA, www.ati-a.nl), richt zich op dergelijke toepassingen. De ontwikkelingen zijn de opmars naar ‘personalized medicine’, dat wil zeggen de juiste behandeling voor de juiste patiënt op het juiste moment.

Kritisch voor het succes van dergelijke methoden en technieken is de combinatie van domeinkennis en slimme ICT: de moderne datascientist werkt samen met biologen, psychologen en medici, én experts op het gebied van machine learning en ICT. Hij weet daardoor de weg in het landschap van medische kennisbanken en geavanceerde modelleringstechnieken toe te passen.

De verwachting is dat de moderne datascientist de eerst komende 5 à10 jaar het verschil zal maken voor betere zorg.

 
Lees het hele artikel
Je kunt dit artikel lezen nadat je bent ingelogd. Ben je nieuw bij AG Connect, registreer je dan gratis!

Registreren

  • Direct toegang tot AGConnect.nl
  • Dagelijks een AGConnect nieuwsbrief
  • 30 dagen onbeperkte toegang tot AGConnect.nl

Ben je abonnee, maar heb je nog geen account? Neem contact met ons op!