Overslaan en naar de inhoud gaan

Statische gegevens stellen eigen eisen aan opslag

"Toen de vorige president van de Verenigde Staten aftrad, droeg hij 146 terabyte aan gearchiveerde gegevens over aan de National Archives in Washington. En dan heb ik het alleen over de gegevens die elektronisch beschikbaar waren. Vergeleken bij zijn voorganger Clinton heeft Bush 50 maal zoveel gegevens gegenereerd”, zegt Yoshida.

Yoshida haalt dit gegeven aan om te illustreren dat bijna ongemerkt steeds meer gegevens worden geproduceerd die bewaard moeten blijven.
Maatschappij
Shutterstock
Shutterstock

Statische gegevens, die volgens de wet bewaard moeten worden in een reproduceerbare vorm. “Het verschil tussen Bush en Clinton is al groot”, zegt Yoshida, “maar het had nog veel groter kunnen zijn. De geheime dienst heeft de presidenten namelijk verboden om er een e-mailaccount op na te houden, in verband met de nationale veiligheid. De huidige president kreeg zo’n verbod ook, maar heeft dat geweigerd. Hij beschikt over een speciaal beveiligde BlackBerry. En wat blijkt? In de eerste honderd dagen van zijn regime heeft Obama al tweemaal zoveel digitale gegevens geproduceerd als Bush in al die acht jaar. De verwachting is dat er aan het eind van de ambtstermijn van Obama letterlijk petabytes overgedragen zullen worden naar het archief.”

Een statisch archief moet anders worden benaderd dan een dynamische opslagplaats van gegevens. In het laatste geval is snelheid van het grootste belang, om wijzigingen zo rap mogelijk door te voeren. Bij grote gebruikers gaat het om honderden zo niet duizenden transacties per seconde. Bij een statisch archief is de snelheid niet zo belangrijk. Wel dient daar veel aandacht te worden gegeven aan de beveiliging van het geheel en de mechanismen die ervoor zorgen dat de content gevalideerd is.

Beheerders van zo’n archiefsysteem zien ook aankomen dat ze meer en meer gegevens moeten opslaan, en maken plannen voor de aanschaf van nieuwe apparatuur. Yoshida: “En dan zie je vaak dat er alleen wordt gekeken naar de initiële kosten, de capital expenditures ook wel capex genaamd. De operationele kosten (opex geheten), het geld dat je kwijt bent om de hele zaak in de lucht te houden, blijft beneden de horizon. Het is ook wel te begrijpen, want als je naar de elektronicawinkel op de hoek gaat, kun je daar een schijf van 1 terabyte kopen voor ongeveer 50 dollar. Dat vertroebelt het beeld. Momenteel is het al zo dat de opex drie- tot viermaal zo hoog is als de capex, en naarmate de hardware goedkoper wordt, kan die scheefgroei alleen maar groter worden.”

Hitachi Data Systems heeft een rekenmodel gemaakt waarmee de kosten van storage inzichtelijk kunnen worden gemaakt. Het geheel is vervat in een spreadsheetmodel, gebaseerd op een serie best practices. “In totaal worden 33 aspecten van de hele opslaginstallatie meegenomen, wat een voldoende fijnmazig beeld oplevert. Het model geeft een algemeen beeld, wat in een workshop nog aangepast kan worden aan de specifieke situatie van de gebruiker”, aldus Yoshida.

De kosten voor hardware worden lager, terwijl de kosten voor beheer en energie juist hoger worden. Een bijkomend aspect is dat van de hardware niet echt efficiënt gebruik wordt gemaakt. “In Europa valt het nog mee, maar in de Verenigde Staten zien we vaak dat een groot storagesysteem voor slechts 20 tot 30 procent wordt benut. De rest is vrije ruimte die vrolijk meedraait op de spinning disks. Nu gebruikt een enkele diskdrive niet zoveel energie, denk aan gemiddeld een watt of 12, maar als je er heel veel van hebt staan, dan tikt het behoorlijk aan. Het is wel mogelijk om energie te besparen door gebruik te maken van solid state disks, alleen spelen dan de aanschafkosten een belemmerende rol. SSD’s zijn nu nog tien tot twintig keer zo duur als een gewone harddisk. Pas als het prijsverschil een factor twee tot drie bedraagt, zullen de gebruikers op SSD’s overstappen”, zegt Yoshida.

Energie moet dan maar op een andere manier worden bespaard, bijvoorbeeld door een deel van de aanwezige disks ofwel langzamer te laten draaien, of ze helemaal uit te zetten. Maar ook dat heeft weer een prijs, want een disk die net is opgestart, kan niet meteen worden gebruikt voor het wegschrijven van gegevens. “Je zult na zo’n restart eerst willen weten of de disk het wel goed doet. Er moet een test worden gedraaid en die kost tijd. De meeste gebruikers nemen daarom de energieverspilling maar voor lief”, stelt Yoshida.

Lees dit PRO artikel gratis

Maak een gratis account aan en geniet van alle voordelen:

  • Toegang tot 3 PRO artikelen per maand
  • Inclusief CTO interviews, podcasts, digitale specials en whitepapers
  • Blijf up-to-date over de laatste ontwikkelingen in en rond tech

Bevestig jouw e-mailadres

We hebben de bevestigingsmail naar %email% gestuurd.

Geen bevestigingsmail ontvangen? Controleer je spam folder. Niet in de spam, klik dan hier om een account aan te maken.

Er is iets mis gegaan

Helaas konden we op dit moment geen account voor je aanmaken. Probeer het later nog eens.

Maak een gratis account aan en geniet van alle voordelen:

Heb je al een account? Log in

Maak een gratis account aan en geniet van alle voordelen:

Heb je al een account? Log in