Overslaan en naar de inhoud gaan

'Github for data' probeert het dataprobleem van AI te managen

De bottleneck bij de toepassing van kunstmatige intelligentie is niet het vinden van het juiste algoritme, maar te zorgen voor de juiste data. Gaible.ai is een startup, die net uit 'stealth-modus' is gekomen en een platform biedt voor data-analisten, machine learning- en softwareontwikkelaars om samen te werken aan het verbeteren van de kwaliteit van datasets. Investeerders noemen het platform al de 'Github voor data'.

zorgelijk
Shutterstock

De drie oprichters van het bedrijf kwamen op het idee het platform op te zetten op basis van hun ervaringen bij Convoy, een Amerikaanse digitale marktplaats waarmee wegvervoerders hun ritten mee kunnen optimaliseren. Dagelijks komen daar complexe datastromen binnen over vrachten, verzenders, locatiegegevens, vervoersbedrijven, vrachtwagengegevens, contracten en prijzen. Chad Sanderson, Adrian Kreuziger and Daniel Dicker waren verantwoordelijk voor de data-afdeling van Convoy en hadden ervaring met datakwaliteit of het gebrek daaraan en de noodzaak van snelle dataverwerking. "Soms was het door de complexiteit bijna onmogelijk simpele vragen te beantwoorden als 'Hoeveel vrachten hebben we de afgelopen dertig dagen behandeld'", zegt Sanderson, nu CEO van Gaible.ai, tegen Venturebeat. 

Communicatie is het probleem

Hij constateerde met Kreuziger en Dicker dat de kern van het probleem zat in een communicatieprobleem tussen de software-engineers en de ontwikkelaars van machinelearning-tools. Toen ze dat aanpakten, verbeterde de kwaliteit van de data bijna gelijk 'exponentieel', volgens Sanderson. De techreuzen kunnen veel data-engineers inzetten om bij de introductie van een nieuw machine learning model de problemen met data op te lossen. Maar kleinere organisaties hebben die luxe niet. Bij Convoy bestond het hele datateam maar uit zes mensen. 

Changemanagement voor data

Ze zetten Gable.ai op om dat communicatieprobleem rond veranderingen in data op te lossen. "Zonder een changemanagementsysteem voor data gaat het je nooit lukken AI goed op te schalen", stelt Sanderson. Het bedrijf heeft een nieuw basic data type geïntroduceerd genaamd 'data contracts' waarin de verantwoordelijkheid voor datasets wordt vastgelegd, net als vereisten aan data en een versiecontrole.

Een bot houdt real time bij waar ontwikkelaars aan werken in de CI/CD workflow en stuurt de gebruikers van de data notificaties wanneer er door veranderingen in nieuwe softwareversies verstoringen in de datastructuren worden gedetecteerd. 

Inmiddels zijn al meer dan 8.000 dataprofessionals met de concepten rond data contracts aan de slag in een Slack community genaamd 'Data Quality Camp'.

Gable.ai heeft nu een financieringsronde succesvol afgerond waarbij veel oprichters van succesvolle databedrijven hebben geïnvesteerd in de startup en daarmee bevestigen zij dat data contracts een onmisbaar onderdeel van de datastack moeten zijn. 

Reacties

Om een reactie achter te laten is een account vereist.

Inloggen Word abonnee

Bevestig jouw e-mailadres

We hebben de bevestigingsmail naar %email% gestuurd.

Geen bevestigingsmail ontvangen? Controleer je spam folder. Niet in de spam, klik dan hier om een account aan te maken.

Er is iets mis gegaan

Helaas konden we op dit moment geen account voor je aanmaken. Probeer het later nog eens.

Maak een gratis account aan en geniet van alle voordelen:

Heb je al een account? Log in

Maak een gratis account aan en geniet van alle voordelen:

Heb je al een account? Log in