Beheer

Storage

Archief in de cloud voor de prijs van tape

2 april 2015

Men betaalt – anders dan bij Googles andere opslagopties in de cloud – behalve 1 dollarcent per gigabyte per maand ook een prijs voor het weer ophalen van gegevens: 1 dollarcent per gigabyte. Naarmate men maandelijks meer gegevens opvraagt, wordt het prijsverschil tussen Google Nearline en de bestaande optie ‘Durable Reduced Availability’ – die 2 dollarcent per gigabyte per maand kost – dus kleiner.

‘Gewone’ opslag in Googles cloud kost momenteel 2,6 dollarcent per gigabyte. Daarvoor krijgt men dan een beschikbaarheid toegezegd van 99,9 procent; voor DRA en Nearline is dat 99 procent. Bij opvragen van Nearline-gegevens is er bovendien een vertraging van enkele seconden. Maar die is veel minder dan wanneer gegevens van tape teruggehaald moeten worden. In dat geval kan het minuten of zelfs uren duren voordat de betreffende gegevens weer online zijn. Dat geldt ook voor Glacier van concurrent Amazon; dat biedt online archiefruimte aan voor een vergelijkbaar bedrag als Google, maar terughalen kost 3 tot 5 uur.

Google beveelt zijn Nearline storage aan voor bepaalde toepassingen waar een zeer hoge beschikbaarheid van data niet nodig is. Dat kunnen de volgende zijn:

  • Opslag van Cold Data, gegevens die niet dagelijks worden gebruikt en waar best even op gewacht kan worden. Een voorbeeld is oude emails, die door een bevoegde instantie worden opgeëist. Die hoeven niet op stel en sprong beschikbaar te zijn, na een paar minuten mag zelfs ook.
  • Disaster recovery, waar oude gegevens nodig zijn om een systeem dat door een ramp is getroffen, weer bruikbaar te maken. Ook daar hoeven gegevens niet binnen luttele seconden te worden opgehoest.

Om van deze opslagtechniek gebruik te kunnen maken, dient een zogeheten Nearline Bucket te worden aangemaakt. Dat is een opslaggebied binnen de cloud van Google, waarvoor speciale voorwaarden gelden. Zo wordt de snelheid van de verbinding bepaald door het aantal terabytes dat iemand heeft opgeslagen. Google gebruikt hiervoor de formule 4 MB/TB. Dat betekent het volgende: een gebruiker die 1 terabyte heeft opgeslagen, kan die informatie met een snelheid van 4 MB per seconde ophalen. Een gebruiker die 3 TB heeft staan, krijgt een snelheid van 3 x 4 is 12 MB per seconde. Het verband is geheel lineair, wanneer een organisatie 100 TB in nearline storage heeft gezet, kunnen de data met 400 MB/sec worden ingelezen.

Wanneer een bucket wordt aangemaakt, mag de gebruiker ook kiezen op welke geografische locatie de data worden neergezet, bijvoorbeeld in de Verenigde Staten. Er zijn momenteel drie keuzes mogelijk: de VS, Europa en Azië. Dit is gedaan om te kunnen voldoen aan wettelijke regelingen, die voorschrijven dat bepaalde gegevens niet buiten een bepaalde regio opgeslagen mogen worden.Naast de hoofdverdeling op continentaal niveau kan er ook nog voor een bepaalde regio worden gekozen. Het is zelfs mogelijk om de opslag te beperken tot één Google datacentrum. In de taal van Google heet zo’n locatie een Google Compute Engine region.De opslagtechniek bevindt zich momenteel echter in de bèta-fase en daarin is het niet mogelijk om de opslag te beperken tot een specifieke regio. Er kan alleen voor een bepaald werelddeel worden gekozen. Als de service de fase van algemene beschikbaarheid ingaat, kan de fijne indeling wel worden gehanteerd.

Vertrouwde benadering

De Nearline Bucket werkt eigenlijk net zo als de Standard Bucket, de online opslagmogelijkheid binnen Googles cloud. Beide worden aangestuurd via dezelfde console met dezelfde API’s. Dat wil zeggen dat de gebruikers geen nieuwe procedures hoeven te leren om van nearline storage gebruik te kunnen maken. Ook de interfaces van hun programmatuur hoeven niet te worden aangepast. Het verschil tussen beide opslagmethoden wordt geregeld door Google, aan de kant van de cloud, de clients hebben er geen omkijken naar.

Gebruikers die hun data naar een Google-omgeving willen brengen, kunnen gebruik maken van de Online Cloud Import. Dat is een dienst, die gegevens van de media van de gebruiker afleest en ze vervolgens opslaat binnen de Google Cloud. Deze techniek is geschikt voor grote tot zeer grote (ettelijke petabytes) hoeveelheden data.

Wanneer moet iemand kiezen voor nearline storage? Google heeft hiervoor de volgende vuistregel gedefinieerd: als je je gegevens niet vaker nodig hebt dan ongeveer een keer per maand en ook best even wil wachten, dan is nearline storage aan te raden.

Amazon was eerder

Amazon levert onder de naam Glacier al langer een nearline oplossing. Opslag van gegevens kost ook hier net zoals bij Google – 1 dollarcent per gigabyte per maand. Dat kan hoger uitvallen als de gebruiker bepaalde eisen stelt. Moeten de data bijvoorbeeld worden opgeslagen in een datacentrum in Ierland, dan dient een prijs van 1,1 dollarcent per GB per maand te worden neergeteld. Wel rekent Amazon pas geld wanneer er grotere hoeveelheden data worden opgevraagd. In principe kan 5 procent van de totale opslaghoeveelheid gratis worden opgevraagd. Wie meer wil, zal een bedrag van 1,1 dollarcent per gigabyte moeten betalen.

Een prijsvergelijking maken tussen Amazon Glacier en Google Nearline is overigens geen sinecure. De cloudgiganten rekenen verschillende prijzen voor het netwerkverkeer bij het opvragen van data. Ook bestandsmanipulatie wordt bij Google heel anders in rekening gebracht dan bij Amazon. Wat de meest voordelige oplossing is, hangt dan ook vooral van het gebruik af. En van het belang dat men hecht aan de beschikbaarheid van gegevens binnen enkele seconden.

 
Lees het hele artikel
Je kunt dit artikel lezen nadat je bent ingelogd. Ben je nieuw bij AG Connect, registreer je dan gratis!

Registreren

  • Direct toegang tot AGConnect.nl
  • Dagelijks een AGConnect nieuwsbrief
  • 30 dagen onbeperkte toegang tot AGConnect.nl

Ben je abonnee, maar heb je nog geen account? Laat de klantenservice je terugbellen!