Spreadsheet-bestanden extra probleem bij eeuwwisseling

21 oktober 1999
Bedrijven in de financiële sector zullen rekening moeten houden met datumproblemen in hun spreadsheets. Men heeft de afgelopen tijd vooral gekeken naar de millenniumbestendigheid van de grote bedrijfskritische systemen, maar de kantoorautomatiseringsbestanden zijn minstens zo belangrijk, zeggen Auke van Nimwegen en Erik Cheizoo. Omdat flexibiliteit een belangrijke eigenschap is van kantoorautomatisering, zal het niet eenvoudig zijn alle spreadsheet-bestanden te schonen.


Auke van Nimwegen en
Erik Cheizoo
In de media wordt de laatste tijd gemeld dat het millenniumprobleem erg meevalt. Volgens de laatste gegevens is het overgrote deel van de bedrijven klaar of verwacht op tijd klaar te zijn. Dit is misschien waar voor de grote bedrijfskritische systemen, maar hoe zit het met de millenniumbestendigheid van de kantoorautomatiseringsbestanden (KA-bestanden)?
Deze lijken op het eerste gezicht niet erg belangrijk, maar in veel gevallen zijn de bedrijfsprocessen afhankelijk van simpele KA-bestanden, met name spreadsheets. Deze bevatten vaak macro’s voor veel voorkomende berekeningen of worden gebruikt voor data-uitwisseling tussen, mogelijk kritische, systemen. Datumfouten hierin kunnen bijvoorbeeld leiden tot foutieve afschrijvingsberekeningen waardoor de kwartaalcijfers niet meer kloppen.
Dit soort problemen zullen zich vooral voordoen in de financiële sector en met name bij accountantskantoren die niet alleen hun eigen gegevens maar ook die van klanten in spreadsheets verwerken. Het verhelpen van deze datumproblemen is niet eenvoudig, door de hoeveelheid, de ongestructureerde data-opslag en verspreiding. Bovendien kan alleen de gebruiker vaak de gegevens juist interpreteren.
Een eigenschap van kantoorautomatisering is de flexibiliteit. Taken die een paar jaar geleden slechts op een minicomputer mogelijk waren, kunnen nu door een medewerker op vrij eenvoudige wijze worden uitgevoerd in bijvoorbeeld een spreadsheet. Creatieve medewerkers hebben wellicht geheel nieuwe toepassingen bedacht, die in spreadsheets zijn geprogrammeerd en een vast onderdeel van, soms zeer kritische, bedrijfsprocessen zijn geworden.
Omdat deze toepassingen bij de IT-afdeling vaak niet bekend zijn, is het erg moeilijk te bepalen wat de gevolgen zijn van millenniumfouten in de kantoorautomatiseringsbestanden. Het is dus zaak alle bestanden door te lichten en millenniumbestendig te houden.
Daarnaast zijn koppelingen met grote systemen op betrekkelijk eenvoudige wijze mogelijk, zodat de gegevens uit spreadsheets uiteindelijk in de centrale databases terecht kunnen komen. Nog een reden om in het millenniumproject kantoorautomatisering veel aandacht te geven.

Uithoeken
Het millenniumbestendig maken van spreadsheets lijkt in eerste instantie een eenvoudige zaak. Tenslotte kunnen de meeste bestanden door de gebruikers zelf worden aangepast en is er slechts in enkele gevallen sprake van programmeerwerk in, relatief eenvoudige, code. Door de verspreiding van de data en verscheidenheid aan applicaties en gebruikers zit de moeilijkheid echter in het beheersen van het project. Bestanden uit alle uithoeken van het netwerk moeten worden gecontroleerd, veel gebruikers moeten worden betrokken bij het herstellen van gegevens. En het millenniumbestendig houden is geen eenvoudige zaak.
De essentie van het millenniumprobleem is dat veel data in twee cijfers worden weergegeven, zodat bij geautomatiseerde systemen bij de eeuwwisseling onduidelijkheid kan ontstaan over de interpretatie van de eeuwaanduiding. Er is een methode ontwikkeld waarmee datums in bestanden niet aangepast hoeven te worden, de interpretatie wordt eenduidig bepaald, dit noemt men date-windowing (zie kader).
Deze methode werkt goed als een enkele applicatie met een enkel date-window een afgebakende hoeveelheid data verwerkt maar in andere gevallen kan dit tot grote problemen leiden. Zo gebruikt Microsoft voor Office 95 een ander date-window dan voor Office 97.
Een nog groter probleem is Windows 98
of Windows 2000 in combinatie met
Office 2000 waarbij het date-window instelbaar is. Hierdoor kan elke werk-
plek potentieel de tweecijferige datums anders interpreteren. Hierdoor blijft de beste methode om datumproblemen te voorkomen er voor te zorgen dat alle data in vier cijfers worden ingevoerd en getoond.
Het grootste probleem is het aanpassen van de bestaande spreadsheet-bestanden, waarin datums vaak standaard in twee cijfers zijn ingevoerd. Er zijn diversen applicaties beschikbaar die hierbij kunnen assisteren. Dit zijn toepassingen die op de werkplek gebruikt kunnen worden om spreadsheets met potentiële datumproblemen te selecteren, in sommige gevallen wordt in de spreadsheet aangegeven waar deze datumvelden zich bevinden.
De praktijk leert echter dat deze applicaties lang niet alle problemen kunnen oplossen. De beschikbare applicaties bieden meestal zoveel opties dat ze te complex zijn om zonder meer door eindgebruikers te worden toegepast. Ze vereisen een opleiding van gebruikers of de toepassing door IT-personeel. Een bijkomend dilemma is dat vaak alleen de eindgebruiker de data juist kan interpreteren en dus moet bepalen hoe tweecijferige datums moeten worden geïnterpreteerd. Bovendien geven de datacheck-applicaties de IT-afdeling geen overzicht in de millenniumbestendigheid van de bestanden op verschillende plaatsen in het netwerk.

Vele miljoenen
Een mogelijke benadering van het probleem met kantoorautomatiseringsbestanden is: het centraal laten controleren van de databestanden door het IT-personeel en het laten uitvoeren van de aanpassingen door de eindgebruikers. Er zal een proces moeten worden opgezet waarbij gebruikers hun bestanden naar een centrale locatie sturen en het IT-personeel met een datacheck-applicatie de KA-bestanden met mogelijke problemen selecteert. Daarna worden de resultaten naar de eindgebruikers teruggestuurd die de geselecteerde bestanden kunnen wijzigen.
Om te voorkomen dat de gebruiker veel tijd nodig heeft voor het wijzigen van bestanden, kan het spreadsheet-programma worden uitgebreid met extensies die dit proces begeleiden. De kosten kunnen verder worden gereduceerd door een goede helpfunctie in deze extensie, waardoor een training van eindgebruikers overbodig wordt. De ontwikkelings- of licentiekosten voor een dergelijke extensie zullen, voor grote organisaties, over het algemeen minder zijn dan de licentiekosten bij gebruik van een datacheck-applicatie voor elke werkplek. Verder brengt deze benadering het productiviteitsverlies van de eindgebruikers terug en dat is vooral interessant voor medewerkers in de dienstverlening met hoge uurtarieven.
Het aantal spreadsheets kan voor sommige organisaties oplopen tot vele miljoenen. De meeste datacheck-applicaties selecteren alle spreadsheets waarin datumvelden voorkomen. Dit kan leiden tot de selectie van het grootste deel van de bestanden. Niet alle datumvelden zullen echter problemen geven na de jaarwisseling. Een betere selectiemethode is om alleen die datumvelden te markeren waarmee wordt gerekend. Een kop boven een kolom die alleen bedoeld is om de maand aan te duiden, is niet interessant. Twee datumvelden waartussen het aantal dagen wordt berekend, kan wel tot foutieve berekeningen leiden.
Verder dienen alle externe referenties te worden gemarkeerd, zodat nagegaan kan worden of de gegevens van deze externe bron op de juiste manier worden doorgegeven. Dit kan het aantal spreadsheets dat door de gebruikers moet worden verwerkt, flink beperken.

Eerste stap
Kantoorautomatiseringsbestanden zijn vaak op veel verschillende locaties aanwezig: lokale schijven van gebruikers (met laptops), verschillende locaties op netwerk-servers, op intranet en in mappenstructuren van E-mail-systemen. Er zal grondig gezocht moeten worden om alle zaken boven water te krijgen. Een mogelijke benadering is om specifieke locaties toe te wijzen waar millenniumbestendige bestanden worden opgeslagen, maar dit vereist wel de medewerking van de gebruiker en zal niet voor alle data mogelijk zijn.
Naast het millenniumbestendig maken van de huidige bestanden zal er ook voor gezorgd moeten worden dat de nieuwe bestanden millenniumbestendig worden aangemaakt. Een eerste stap kan zijn de gebruikers bewust te maken van de problemen. Microsoft Excel biedt de mogelijkheid om een (gratis) extensie aan het programma toe te voegen waardoor gebruikers gedwongen worden datums met vier cijfers in te voeren. Voor andere pakketten zullen dergelijke extensies mogelijk geschreven moeten worden.
Ook hier is de technische aanpassing maar een deel van het probleem. De extensie zal op alle werkstations moeten worden geïnstalleerd en voor organisaties die meerdere spreadsheet-applicaties gebruiken, zal voor elk pakket een passende oplossing moeten worden geboden.
Nadat alle bestanden zijn gecontroleerd en de programmatuur geen datumvelden van twee cijfers meer kan produceren, zal gewerkt moeten worden aan het millenniumbestendig houden van de omgeving. Spreadsheets worden, via diskettes of
E-mail, eenvoudig uitgewisseld met externe partijen. Ook het gebruiken van een verkeerde kopie (bijvoorbeeld een reservebestand dat nog op een diskette stond) kan weer spreadsheets met millenniumproblemen introduceren.
Het controleren van de bestanden zal in de komende maanden regelmatig moeten worden uitgevoerd. Grote organisaties kunnen overwegen een aparte helpdesk in te richten om gebruikers te adviseren en controle op bestanden uit te voeren. Uiteraard stopt het millenniumbestendig houden van spreadsheets niet op 1 januari 2000, veel werk begint dan pas.





Auke van Nimwegen en Erik Cheizoo zijn respectievelijk managing partner en senior consultant bij Centior BV, te Maarssen.
Date-windowing

Om zonder alle datums aan te passen data toch millenniumbestendig te maken, werkt men wel met een techniek die ’date-windowing’ wordt genoemd. Men neemt een beslissing over welke tweecijferige datums in de twintigste eeuw vallen en welke in de eenentwintigste eeuw. Zo stelt men bijvoorbeeld dat 70 tot 99 wordt vervangen door 1970 tot 1999 en 00 tot 69 door 2000 tot 2069.
Dit heeft echter beperkingen. Voor datums in de nabije toekomst of het vroege verleden is deze aanname waarschijnlijk wel juist. Voor datums in de verre toekomst of het verre verleden is het echter niet zo zeker dat er juist wordt geïnterpreteerd. Wordt met ’50’ 1950 of 2050 bedoeld? De interpretatie moet wel eenduidig zijn.
Deze ’date-window’-methode wordt door applicatieleveranciers op diverse manieren toegepast:
1. Een vast window; bijvoorbeeld 1920-2039 (Office 95), 1930-2029 (Office 97) of
1950-2049 (Lotus 1-2-3).
2. Een door de gebruiker in te stellen window (Windows 98/2000).
3. Een schuivend window, waarbij de interpretatie van de eeuw wordt gerelateerd aan de huidige datum (bijvoorbeeld een window van +30, waardoor 32 dit jaar als 1932 wordt geïnterpreteerd en in 2001 als 2032).
De door Microsoft aangebrachte functie in Windows 98 en Windows 2000 maakt de zaak nog gecompliceerder. Het date-window is bij deze Windows-versies door de gebruiker zelf in te stellen, wat een voorspelbaar gedrag volkomen onmogelijk maakt. Zo zou een situatie kunnen ontstaan waarbij op de ene werkplek ’10’ als 1910 wordt geïnterpreteerd, terwijl bij andere werkplekken er 2010 van wordt gemaakt. Hier introduceert het date-window meer problemen dan het oplost.
Een ander sprekend voorbeeld van misinterpretatie is het kopiëren van gegevens tussen Quattropro- en Excel-spreadsheets. Een cel met datum 1/1/20 wordt in Quatropro gezien als
1 januari 2020. Kopiëren we de cel naar Excel en veranderen we de notatie in een viercijferige jaaraanduiding dan blijkt de datum 1 januari 1920 te zijn doordat deze applicaties dezelfde data met een ander default date-window bekijken.
 
Lees het hele artikel
Je kunt dit artikel lezen nadat je bent ingelogd. Ben je nieuw bij AG Connect, registreer je dan gratis!

Registreren

  • Direct toegang tot AGConnect.nl
  • Dagelijks een AGConnect nieuwsbrief
  • 30 dagen onbeperkte toegang tot AGConnect.nl

Ben je abonnee, maar heb je nog geen account? Neem contact met ons op!