Innovatie & Strategie

Artificial Intelligence
Wereldbol op monitoren

Coronadataset online gedeeld voor AI-analyse

Al 29,000 papers over het wereldwijd woedende virus op één plek. 

© 0CC - Pixabay gerapt
23 maart 2020

Al 29,000 papers over het wereldwijd woedende virus op één plek. 

AI-hulp gevraagd voor bestrijding van het nieuwe coronavirus. Hoe dan? Door AI-kracht los te laten op een geopenbaarde en uitdijende dataset. CORD-19, zo heet de Open Research Dataset over COVID-19 met inmiddels al 29,000 wetenschappelijke artikelen. Vorige week waren dat er nog 24,000. Deze openbare dataset moet informatie over de coronavirusfamilie sneller verspreiden onder researchers, in de hoop sneller een vaccin te vinden.

Sinds COVID-19 is uitgeroepen tot een officiële pandemie, hebben diverse organisaties zich gestort op het vergaren van wetenschappelijke informatie over het virus. Daaronder ook het Allen Institute for AI, opgericht door Microsoft-grondlegger Paul Allen. Dat AI-instituut heeft de handen ineengeslagen met andere grote onderzoekscentra om te zorgen dat alle wetenschappelijke corona-informatie op één plek te vinden is. De hieruit voorgekomen database is online te vinden op Semantic Scholar. Om toegang te krijgen tot de database hebben geïnteresseerden wel een geldige Dataset License nodig.

Hoe meer, hoe beter

Vorige week stonden er nog 24,000 wetenschappelijke artikelen in de database, waar dat er deze week al 29,000 zijn. Kaggle, een platform voor de datascience community, organiseert nu de COVID-19 Open Research Dataset Challenge. Daarmee wil Kaggle belangrijke vragen beantwoord krijgen over het virus, zoals de geschiedenis, diagnostiek van het virus, beheersmaatregelen op het mens-dier-grensvlak, en meer. 

De database is opgezet in opdracht van het White House Office of Science and Technology Policy (OSTP), meldt de gerenommeerde vaktitel MIT Technology Review. Het vullen van deze wetenschappelijke database voor AI-analyse is mede verzorgd door de Amerikaanse National Library of Medicine (NLM). Die instantie heeft toegang gegeven tot al bestaande onderzoeken naar de coronavirusfamilie.

AI-voorbewerking

Vervolgens heeft Microsoft zijn algoritmes voor het cureren van literatuur ingezet om relevante artikelen te vinden. Daarna heeft het Allen Institute for AI zijn technologie voor kunstmatige intelligentie (AI) gebruikt om de artikelen om te zetten van webpagina's en PDF-bestanden in een gestructureerde opzet die dat kan worden verwerkt door algoritmes. 

Lees meer over Innovatie & Strategie OP AG Intelligence
Reactie toevoegen
De inhoud van dit veld is privé en zal niet openbaar worden gemaakt.