Management

Zoektocht naar de juiste databasevragen
Promovendus ontwikkelt database-tool voor wie nog niet weet wat hij weten wil
Promovendus ontwikkelt database-tool voor wie nog niet weet wat hij weten wil
Wie precies weet welke informatie hij zoekt kan vanzelfsprekend goed terecht bij een databasesysteem. Maar wie niet precies weet wat hij weten wil, zal een database al gauw als een sfinx ervaren. Er is echter bemiddeling denkbaar.
Databasemanagementsystemen sluiten impliciet een overeenkomst met de gebruiker. Ze geven snelle en correcte antwoorden in ruil voor precieze en complete vragen, correct gesteld in een query-taal zoals SQL. Gebruikers die onbevangen op zoek zijn naar interessante gegevens zonder veel kennis van de database en de inhoud ervan, zijn aangewezen op zoeken via trial-and-error. Maar dat is, vooral bij grote databases, tijdrovend en bovendien vaak weinig effectief; het gevaar is groot dat wel degelijk in de data besloten relevante inzichten niet boven water worden gehaald.
Vier assistenten
Maar daar hoeft het niet bij te blijven, denkt Thibault Sellam van het CWI. In het kader zijn een promotie-onderzoek ontwikkelde hij technieken, en software, om grote databases verkennend te doorzoeken. Met zijn aanpak zouden gebruikers zonder noemenswaardige kennis van de data vooraf, interessante informatie boven water kunnen krijgen. Sellam ontwikkelde vier database-assistenten die gebruikers helpen om productieve query’s te formuleren en bij te schaven:
- Claude stelt hypotheses op voor databases door statistische afhankelijkheden tussen verschillende dimensies van de database te gebruiken
- Blaeu helpt gebruikers om query’s te formuleren door hen clusters van objecten te laten selecteren
- Ziggy laat zien wat een selectie objecten uniek maakt door de verschillen met de rest van de database te laten zien
- Raimond detecteert en organiseert tekstfragmenten die een nieuwswaardige gebeurtenis beschrijven, bijvoorbeeld op social media.
Sellam heeft de vier assistenten zijn, samen met andere inzichten uit zijn onderzoek, geïmplementeerd in het softwarepakket findviews voor R, beschikbaar op Github. Hij verdedigt zijn proefschrift komende donderdag 3 november aan de Universiteit van Amsterdam (UvA). Sellam voerde zijn onderzoek uit in de Database Architectures (DA) groep van het CWI, onder begeleiding van prof. dr. Martin Kersten en gefinancierd door het nationale onderzoeksprogramma COMMIT/.
Voormalig redacteur van AG Connect. Schreef met name over de bedrijfseconomische en organisatorische facetten van IT. Artikelen gaan onder meer over waardecreatie met IT, digitale transformatie, IT-governance, juridische kwesties en het c-level perspectief op IT. Met zo nu en dan een uitstapje naar toegepaste wis- en natuurkunde.