Beheer

IT beheer
Storing

De menselijke fout

Ook met de beste bedoelingen kan je een keer op een foute knop drukken.

1 december 2021

Facebook, WhatsApp en Instagram waren onbereikbaar, wereldwijd. Door een menselijke fout.  Vodafone had weer een fikse storing in Nederland.  Een menselijke fout.  Bij vrijwel elke storing of ramp kun je de mens de schuld wel geven.

Is de techniek ons boven het hoofd gegroeid, en is de vraag niet of er een ramp of storing komt, maar hooguit wanneer? Is de techniek onvoldoende scherp ontworpen, waardoor een ongeluk in een klein hoekje zit?

Als je een veiligheidskritische functie ontwerpt, is het verstandig om te kijken of je het veiligheidsprobleem kunt elimineren. Ga pas als dat niet kan, nadenken over weg-engineeren. Kan dat niet? Dan procedures, en als dat niet (alleen) kan, resteren nog opleiding, training en oefening.

Ook met de beste bedoelingen kan je een keer op een foute knop drukken. Straaljagerpiloten kun je er op testen tot je een ons weegt, de kans dat ze abusievelijk op de eject drukken is niet nul.  Omgekeerd gebeurt helaas ook: niet drukken als het wel moet gebeurt. Die kans minimaliseer je door trainen in een simulator. Maar je krijgt 'm niet weg.

Een voorbeeld van hoe lastig dat elimineren en weg-engineeren is: in april 2016 werden twee computervirussen aangetroffen in de Gundremmingen kerncentrale, waaronder W32.

Ramnit en Conficker.

Besmetting was dus niet voorkomen, omdat de centrale niet op internet was aangesloten bleef de schade beperkt.

Het is een simpele en heldere procedure: kerncentrales niet op internet aansluiten. Wat kan dan nog misgaan? In 2019 bleek dat in de Yuzhoukrainska kerncentrale iemand illegaal was gaan cryptominen, en de fabriek met het web had verbonden. Daardoor ontstond een significant gevaar voor de cybersecurity.  Er werd zelfs een glazvezelkabel in beslag genomen, de overtreders hadden geen half werk geleverd.

Als je CPU-power beschikbaar stelt voor het minen, kun je geld verdienen. Dus waar CPU 'over' is, kun je dit verwachten. Bijvoorbeeld in 2018, toen een supercomputer zou zijn aangesloten op internet op het terrein van een supergeheime Russische kernkoppenfabriek. Allemaal om een centje bij te verdienen met cryptominen.

Dus zelfs meest heldere procedures -niet aansluiten op internet- moeten toch op de lijst van 'eerst elimineren, dan weg-engineeren', voordat je het als procedure kunt afdoen. Want er is altijd een bizarre reden waarom ervan wordt afgeweken die je van te voren niet had kunnen bedenken. Misschien is vertrouwen op heldere procedures wel de meest menselijke fout.

Magazine AG Connect

Dit artikel is ook gepubliceerd in het magazine van AG Connect (novembernummer 2021). Wil je alle artikelen uit dit nummer lezen, klik dan hier voor de inhoudsopgave.

Reactie toevoegen