Programmeerfout bracht Skype op de knieën

Een dergelijk ernstige storing leek bij de door Skype gekozen architectuur niet mogelijk. Het Skype-netwerk kent een peer-to-peer-opzet. De beheer- en verbindingstaken die in andere netwerken worden uitgevoerd op een centrale server, worden in Skypes netwerk gedistribueerd uitgevoerd, door ‘supernodes’. Daardoor zou een eventueel probleem in theorie beperkt moeten blijven tot kleine delen van het netwerk.
Maar die theorie gaat niet op als er te veel supernodes tegelijk uitvallen. En dat is precies wat er op 22 december gebeurde. Met als oorzaak een programmeerfout in een van de versies van de Skype-software. Ongelukkig genoeg was dat wel de meest gebruikte versie. De kwetsbare Windows-clientversie 5.0.0152 was in gebruik bij 50 procent van de Skypers.
Drukte brengt probleem aan de oppervlakte
De problemen werden uitgelokt door drukte op het instant-messagingkanaal. Dat leidde tot overbelasting van een aantal ondersteunende servers voor het instant-messagingverkeer, en vertraging in de afhandeling van dat verkeer. En dat was iets waar de clients met Skype for Windows versie 5.0.0152 niet tegen konden. Door het uitblijven van antwoord en doordat er geen adequate reactie op die conditie was geprogrammeerd in juist deze versie, liep 40 procent van de clients met Skype for Windows versie 5.0.0152 vast.
Omdat een belangrijk deel van die vastgelopen clients ook supernode was, begon het probleem zich te adverteren door het netwerk. Het werk dat de 25 tot 30 procent van de getroffen supernodes normaal gesproken deden, werd doorgeschoven naar andere supernodes. Die raakten daardoor overbelast, vielen soms ook uit, en lieten daardoor weer nieuwe systemen met de kwetsbare client vastlopen. Extra problemen ontstonden door de vele Skypers die hun vastgelopen applicatie herstartten. Skypes beheerders signaleerden het probleem wel snel, en kwamen ook in actie, maar liepen eigenlijk steeds achter de feiten aan doordat steeds nieuwe supernodes uitvielen.
Skype neemt maatregelen
Skypes CIO Lars Rabbe belooft op de blogsite van Skype beterschap. Onderzocht zal worden of de beheerders van het Skype-netwerk effectiever op kunnen treden tegen dit soort storingen. Er zal een hotfix voor het probleem verspreid worden, en de bestaande software zal aan een extra inspectie worden onderworpen om potentiële problemen op te sporen. De testprocedures zullen geëvalueerd en zo nodig herzien worden. Skype overweegt automatische updates uit te gaan uitvoeren, zodat iedereen op de meest recente versie werkt (al had dat niet geholpen toen Windows-versie 5.0.0152 de meest recente was). Geplande investeringen voor 2011 zullen de capaciteit van de ondersteunende systemen vergroten.
Reacties
Om een reactie achter te laten is een account vereist.
Inloggen Word abonnee