Innovatie & Strategie

Datamanagement
Dataloog DataNieuws18 maart 2021

De Dataloog: DTL DataNieuws, shownotes 18 maart 2021

Redactie AG Connect verzorgt samen met podcast De Dataloog de DataNieuws-uitzending.

© De Dataloog
19 maart 2021

Redactie AG Connect verzorgt samen met podcast De Dataloog de DataNieuws-uitzending.

Dit zijn de shownotes bij de Datanieuws-aflevering van De Dataloog van 18 maart 2021.

 

 

Het DataNieuws is de nieuwsupdate van De Dataloog, dé Nederlandse podcast over Big Data, Data Science, Machine Learning en de datagedreven transformatie. Wij brengen de digitale datagedreven wereld dichtbij in het Nederlands en op een begrijpelijke manier.

Goed nieuws uit Nederland

Luchtzuivering met minder CO2

Techport organiseert in het voorjaar van 2021 een Techport Challenge voor innovatieve MKB-bedrijven en startups om innovaties en oplossingen te ontwikkelen om met smart technologie de emissie te kunnen reduceren in de IJmond en de Metropoolregio Amsterdam. 

De winnaar van de Techport Challenge is bekend; André Kapitein heeft met Blue Reactor System deze plek in de wacht gesleept! BlueReactor heeft in samenwerking met de Technische Universiteit Eindhoven een unieke technologie ontwikkeld om ongewenste gassen en geur uit de lucht te zuiveren zónder gebruik te maken van water, chemicaliën en of filter systemen en heeft daarbij een tot 95% lagere CO2 footprint dan traditionele reinigingsmethodes.

Blue Reactor Systems wordt de komende 3 maanden begeleid in het GO!-NH Growth versnellingsprogramma door middel van workshops, netwerkbijeenkomsten en coaching. Maandag 15 maart start het programma met een vierdaagse intensieve bootcamp.

Technologiekieswijzer

Het is nog net verkiezingstijd en daarom belden we even met Rudy van Belkom, de man achter de Technologiekieswijzer.

Picnics ETL-pijplijn

Matthieu Caneill, data & software engineer bij Picnic, deelt tips om een gedistribueerde ETL-pijplijn te bouwen voor een monolithisch datawarehouse.
Lessons learned:

  • Bereid je voor op mislukkingen: Reparaties en aanpassingen horen bij het werk en zijn geen uitzondering.
  • Kies de juiste tools: SQL is handig voor datamanipulatie, maar Python wint het als het op automatisering aankomt.
  • Documenteer het niet-voor-de-hand-liggende: binnen Picnic zijn er vele malen meer scripts dan dat ze engineers hebben. Dus is het belangrijk om goed te documenteren zodat het eenvoudig is om te begrijpen wat er precies gebouwd is en waarom het is gebouwd zoals het is gebouwd. Inline documentation, version-controlled markdown naast de code voor hoger niveau overzicht, en een wiki voor alle andere zaken.

Goed nieuws uit de wereld

Hoe vruchten van ML plukken

Nagenoeg alle (98%) van de IT-leiders gelooft dat machine learning (ML) hun bedrijf een beslissend concurrentievoordeel zal geven. Maar slechts een kleine minderheid (6%) meent dat nu MLOps capabilities volwassen genoeg zijn om de vruchten van ML te kunnen plukken. Dit teleurstellende beeld komt naar voren uit een recent rapport van onderzoeksbureau Forrester.

HPE-topman Doug Cackett licht wat oorzaken toe aan de hand van 6 'industrialized lessons learned from lean manufacturing'. Naast bekend te veronderstellen zaken als de juiste tooling, een gericht R&D lab en een goed ingerichte supply chain noemt hij daarbij ook een aantal Japanse termen: Jidoka, Kaizen, Poka-yoke. We leggen die even uit, én wat ze kunnen betekenen voor analytics. Om dan de voordelen van ML te kunnen realiseren, de vruchten van ML te plukken.

Brand in Frans datacenter

De cloud heeft de reputatie van resiliency; rampenbestendigheid. Maar dat is geen gegarandeerde eigenschap, en gebruikers moeten goed oog hebben voor hun data en een rampenherstelplan daarvoor. Kritisch kijken naar datacenters en uitwijkmogelijkheden is cruciaal. Het recente afbranden van een OVH-datacenter in Straatsburg heeft dat op harde wijze duidelijk gemaakt. Miljoenen websites zijn plat gegaan door die flinke brand waarbij het hele gecontaineriseerde datacenter is vernietigd. Het dashboard stond flink op rood, ook dagen later nog. Gelukkig waren data de enige slachtoffers van deze ramp.

Academisch nieuws

Datageletterdheid

In welke mate zijn werknemers van een organisatie datageletterd? Want de data literacy van mensen bepaalt of en hoe ze (goed) kunnen werken met data, op gepast niveau dus. Dit kan een opstap of juist een struikelblok zijn voor de transformatie naar een datagedreven organisatie.

Uit recent Gartner-onderzoek blijkt dat chief data officers slechte datageletterdheid zien als één van de drie voornaamste hindernissen voor het vormen van een sterk data- en analyticstea. Een onderzoek van Accenture naar datageletterdheid onder meer dan 9000 werknemers, in diverse functies, wijst uit dat slechts 21% vertrouwen had in hun eigen data literacy skills.

MIT Sloan heeft een artikel over datageletterdheid gepubliceerd en geeft daarin een achttal belangrijke inzichten. Nummer 4 zal je verbazen? ;)

Securitynieuws

Data is je organisatie. Welkom2020!

Waarom dat vreemde welkomstwoord? Omdat dat een praktijkvoorbeeld is van een zwak wachtwoord. Een te zwak gebleken wachtwoord, wat uiteindelijk voor miljoenen aan schade heeft gezorgd. De geslaagde datagijzeling, plus datavernietiging, bij de gemeente Hof van Twente viel te voorkomen, zo bleek uit forensische rapporten naar aanleiding van deze cyberaanval in december vorig jaar. Natuurlijk, veel IT-rampen vallen (vaak) te voorkomen. Maar dit was wel een aaneenschakeling van basale beveiligingsmissers.

Bijkomend data-inzicht: niet alleen komt er veel neer op data, het kunnen lézen van data door mensen is ook van belang. Zoals het goed lezen en begrijpen van een pentestrapport dat in mei vorig jaar is opgesteld. Was in dat security-onderzoek wel alles meegenomen, was het rapport wel duidelijk en goed onderbouwd? Moest er misschien worden doorgevraagd? Nu terugkijkend staan de antwoorden op die vragen ter discussie.

Privacynieuws

Data van Uber, over chauffeurs

De Amsterdamse rechtbank heeft geoordeeld dat Uber zich niet schuldig heeft gemaakt aan 'algoritme-ontslag'. Bij het schrappen van de accounts van Uber-chauffeurs was "geen sprake van uitsluitend op geautomatiseerde verwerking gebaseerde besluiten", aldus het vonnis. De mens was dus wel betrokken bij het ontslag, maar Uber heeft de redenen voor de contractbeëindiging niet duidelijk genoeg gemaakt.

Het blijkt om fraude door de chauffeurs te gaan. Bij twee van hun moet Uber van de rechter echter nog aanvullende data overdragen; om de gronden voor de Uber-deactivering duidelijk te maken. Terwijl het vervoersbedrijf meldt dat de chauffeurs alle data geleverd hebben gekregen waarop zij recht hebben, moet het bedrijf nog een stap verder gaan van de rechter. "Uber moet deels nog wel inzage geven in de concrete verwijten die hebben geleid tot het besluit tot deactivering van de accounts", bepaalt de rechter.

Stem op briljante mislukking

De stichting 'Corona in kaart' heeft zichzelf eind vorig jaar opgeheven, vanwege gebrek aan succes. En nu, nu roept de stichting op om te stemmen op hun briljante mislukking. "Regel het nu goed voor Corona en straks voor andere zorgdata! Geef ons een tweede kans met uw stem!"

Cloudnieuws

Veel ICT komt vanuit de Verenigde Staten, veel cloud komt vanuit Amerikaanse en ook Chinese giganten. De afhankelijkheid van buitenlandse techleveranciers is groot, en groeiende. Als tegenbeweging voor deze afhankelijkheid is er nu de Dutch Secure Autonomous Cloud (DUSAC), een Nederlands initiatief voor een veilige cloud. Geen tegenhanger voor AWS, Microsoft Azure, of Google Cloud. Maar wel een opzet die op termijn veel voor Nederland kan betekenen. Nederland als diensenland, datacenterland en data-exchangeland.

De data-uitagenda/Events

Digital Twinning, donderdag 25 maart

Op donderdag 25 maart van 16:00 – 17:00 uur nemen het Koninklijk Nederlands Lucht- en Ruimtevaartcentrum (NLR) en Fieldlab ACM3 ons mee in het thema Digital Twinning. De kern van innovatie is de wens om moderne technologie in te zetten om efficiënter te kunnen werken en produceren.

Niet alleen om met de tijd en snelle ontwikkelingen mee te gaan, maar juist om als mkb wendbaar, inzetbaar en winstgevend te blijven. Digital Twinning is een ontwikkeling die het mogelijk maakt om op efficiënte wijze nieuwe inzichten te krijgen in je bedrijfsprocessen. Koninklijke NLR deelt graag de verschillende toepassingen van Digital Twins aan de hand van concrete voorbeelden van collega-ondernemers en demonstraties.

Autonoom geteelde sla, juni 2021 - juni 2022

Wageningen University & Research en Tencent houden tussen juni 2021 en juni 2022 voor de derde keer een International Autonomous Greenhouse Challenge. Multidisciplinaire teams van over de hele wereld gaan met behulp van kunstmatige intelligentie op afstand sla produceren. Het doel is een volledig geautomatiseerde en autonoom gecontroleerde kas, zonder tussenkomst van de mens.

Lees meer over Innovatie & Strategie OP AG Intelligence
Reactie toevoegen
De inhoud van dit veld is privé en zal niet openbaar worden gemaakt.