Beheer

Analytics
data pipes

Automatisch databronnen combineren, lost dat AIOps-probleem op?

Bij Robotic Data Automation (RDA) snorren bots zelfstandig de juiste data op.

© Shutterstock eliahinsomnia
23 juni 2022

Bij Robotic Data Automation (RDA) snorren bots zelfstandig de juiste data op.

AIOps, het automatiseren van processen binnen de IT-afdeling, heeft grote potentie, maar bedrijven worstelen met de implementatie. De loggegevens die nodig zijn om datapijplijnen in te kunnen richten zijn er vaak niet of zijn lastig vrij te maken uit processen. Is Robotic Data Automation (RDA) hier een goede oplossing voor? “Ik vind het nogal pretentieus.”

Rein Mertens, verantwoordelijk voor de afdeling Customer Advisory bij SAS, herkent het beeld dat bedrijven moeite hebben met AIOps door het gebrek aan kwalitatief goede data om processen mee in te richten. “Maar het speelt niet alleen bij AI-systemen, een gebrek aan goede kwaliteit data is van alle tijden. Om een proces goed te kunnen automatiseren moet je heel goed helder hebben welke data dit vereist en of het voor dat specifieke proces de juiste kwaliteit heeft.”

Automatisering bespaart

Het probleem is dat de professionals met de juiste kennis van datakwaliteit, zoals data engineers en data scientists, schaars zijn. Organisaties zien het automatiseren van IT-taken en servicemanagement dan ook als mogelijke oplossing om het hoofd te bieden aan dit tekort aan specialisten. “Je ziet dat de capaciteit van de schaarse mensen die je hebt, vaak verloren gaat aan taken die je inderdaad kunt automatiseren. Zo kan een groepje data scientists veel tijd bezig zijn met niet alleen het maken van een model, maar ook om de benodigde data te vergaren en te prepareren om vervolgens druk te zijn om het model daadwerkelijk in productie te krijgen. In dat hele proces zijn er zeker onderdelen die je kunt automatiseren om de randgebieden sneller te maken”, zegt Mertens.

Dat automatiseren zorgt er dan niet alleen voor dat mensen met specifieke kennis op de complexere uitdagingen kunnen worden gezet, het zorgt er bovendien voor dat de foutmarge daalt, stelt Reinoud Kaasschieter, werkzaam bij Capgemini als onder meer expert op het gebied van AI en ethiek. “Automatisering in het algemeen bespaart niet alleen mensen, tijd en geld, maar zorgt ook voor een verbetering omdat je de mens als foutbron uitschakelt. Bovendien kan een computer veel sneller en veel meer data verwerken dan een mens, dus er vindt ook een versnelling plaats.”

Juiste data gebruiken

Volgens onderzoeksbureau Forrester blijft tot 73% van de bedrijfsdata ongebruikt voor analyse en inzicht. Dat komt doordat data vaak verspreid staan, zegt Kaasschieter. “Bedrijven weten veelal niet eens welke data ze hebben. Bovendien zijn data soms niet of heel lastig te ontsluiten. Of lastig te interpreteren, omdat ze afhankelijk zijn van een bepaalde context van een specifieke applicatie.”

Ook Mertens ziet dat bedrijven nog niet alle beschikbare data inzetten om slimmer te worden, hoewel hij zijn vraagtekens zet bij het specifieke percentage van Forrester. “Er worden natuurlijk steeds meer data gecreëerd en dan is het voor bedrijven best ingewikkeld om al die soorten data om te zetten in kennis rondom bijvoorbeeld hun klanten. Daarnaast, en dat blijft actueel, zijn veel organisaties nog steeds huiverig om data te gebruiken door wetgeving en ethische discussies. Al dan niet terecht zijn organisaties bang voor een schandaal of boetes wanneer ze data gebruiken voor inzicht.”

Pretentieus concept

Om de uitdagingen die bedrijven hebben bij het gebruik van data het hoofd te kunnen bieden, hebben organisaties als Snowflake, CloudFabrix en Dremio een nieuw concept ontwikkeld: Robotic Data Automation. Daarmee worden datapijplijnen tussen verschillende gegevensbronnen geautomatiseerd op een manier die vergelijkbaar is met hoe RPA bedrijfsprocessen heeft getransformeerd.

RDA zou de ontbrekende schakel kunnen zijn voor het implementeren van samengestelde data en analytics door DataOps te integreren met de ModelOps, MLOps en PlatformOps frameworks. “Ja, dat vind ik toch echt wel wat kort door de bocht. Het klinkt vrij pretentieus. Wat ik me namelijk afvraag is: Hoe slim zijn die stukjes technologie, die RDA-bots dan? Want als je data wilt combineren moet je altijd kijken of je het over dezelfde definitie hebt. Ik ben altijd een beetje huiverig als je dat helemaal gaat automatiseren en zo’n systeem zelf op zoek laat gaan en data aan elkaar laat knopen”, zegt Mertens.

“Tegenwoordig kun je een heel proces van automatisering besturen via scripts of code. Vroeger moest je fysiek een server aan of uit zetten, maar tegenwoordig, met Infrastructure-as-a-Code, kun je een script virtueel ergens in de cloud iets laten opstarten. Dat betekent dat je daarmee al een meer verregaande automatisering kunt bewerkstellingen. Dat begon met DevOps en vervolgens DataOps – in een heterogene omgeving dataprocessen automatiseren – en MLOps – de kant van het in productie krijgen van modellen. En nu komt daar een nieuw concept overheen dat pretendeert dit allemaal te kunnen, inclusief het platform. Dat klinkt veelbelovend, maar ik zie het nog niet zo gemakkelijk worden toegepast.”

Specialisten blijven nodig

Volgens Kaasschieter vereist het opbouwen van een datapijplijn menskracht en kennis en kunnen dit soort processen pas worden geautomatiseerd wanneer ze al grotendeels uitgekristalliseerd zijn. “Dat geldt eigenlijk voor ieder proces dat je automatiseert. Je moet vooral heel gedetailleerd en goed bepalen wat je wilt gaan doen. Vervolgens kun je bekijken welke stappen je kunt automatiseren. Dat moet je vooral helemaal uitwerken, omdat je anders steeds aanpassingen moet gaan doen die verregaande consequenties hebben in het proces. Je moet de bots namelijk op gedetailleerd niveau instrueren wat ze moeten doen, want ze zijn niet intelligent.”

Waar het dan voornamelijk om gaat is dat repetitieve, menselijke handelingen in servicemanagement en IT-taken worden geautomatiseerd, zodat data scientists en data engineers worden vrijgemaakt om complexere taken uit te voeren. “Maar je blijft deze mensen hoe dan ook nodig hebben in het proces, omdat zij degenen zijn die de bots moeten en kunnen controleren. Het is niet zo dat je een bot bouwt, in werking stelt en achterover kunt leunen. Je moet continu blijven kijken of de bots goed functioneren, zeker in een dynamische omgeving. Hoe stabieler het datalandschap en de datastromen binnen een organisatie, hoe meer rendement je uit RDA kunt halen, maar in een dynamische omgeving zie ik vooralsnog geen heel grote voordelen.”

 

Reactie toevoegen
De inhoud van dit veld is privé en zal niet openbaar worden gemaakt.