Gigantische datastroom richting Amsterdam

17 oktober 2008
De ontvangers van de data bevinden zich in de zogeheten Tier-2 centra, waar deelonderzoeken op de data worden verricht. “SARA en NIKHEF fungeren bij dit project als partners. Inmiddels staat bij SARA reeds een hoeveelheid hardware opgesteld, maar die zal in de nabije toekomst verder worden uitgebreid”, zegt Ron Trompert, adviseur bij SARA en deskundige op het gebied van high-end storage en grids.

In totaal zijn er 11 Tier-1 locaties, verspreid over de hele wereld. Tussen CERN (dat met Tier-0 wordt aangeduid) en deze centra ligt een uitgebreide infrastructuur die is gebouwd als een grid. Er wordt gewerkt met grote bandbreedtes. Een datatransport van 100 megabyte per seconde en dat uren achter elkaar zal geen zeldzaamheid zijn. Trompert: “Er wordt gewerkt in zogeheten bursts, forse datapakketten die in een aantal uren worden overgedragen.”

Inmiddels heeft SARA de eerste meet­gegevens al binnengekregen, op 10 september was de primeur. De gegevens worden opgeslagen op zowel tapes als disks. SARA heeft nu al ruim 600 terabyte diskcapaciteit. “Die hoeveelheid wordt verder uitgebreid. De huidige plannen hebben een uitloop tot 2011-2012 en tegen die tijd zullen we de beschikking hebben over 5 petabyte diskopslag en 8 petabyte op tape”, aldus Trompert.

De genoemde 100 MB/sec heeft betrekking op de data die door Atlas worden geleverd. SARA krijgt echter ook nog uit andere bronnen gegevens, dus moet rekening worden gehouden met meer bandbreedte. Trompert: “Denk dan aan 150 MB/sec, zodat ook de data van de meetmodules LHCb en ALICE verwerkt kunnen worden. En om helemaal zeker te zijn, streven we naar een bandbreedte van 300 MB/sec, dan zijn we op alles voorbereid.”

In Amsterdam wordt niet alleen gezorgd voor een veilige opslag van de meetgegevens, er is ook verwerkingscapaciteit beschikbaar. Daarvoor staat er een clustersysteem, dat is gevuld met 808 Intel-processors, en deze leveren een rekenkracht van 4 teraflops. De cluster is een product van Clustervision en Dell, op basis van dual- en quadcore Xeons.

De gegevens die in Amsterdam aankomen, zijn afkomstig van de detector met de naam Atlas. Deze meet een aantal eigenschappen van de deeltjes in het systeem. Hun lading wordt bepaald, evenals de kinetische energie. Het zou weinig zin hebben om alle gegevens die Atlas registreert zomaar op te slaan en het grid in te sturen. In plaats daarvan wordt gebruikgemaakt van een triggersysteem, dat van de miljarden events die per seconde optreden de interessantste uitzoekt en daarvan alle gegevens verzamelt. De gegevens worden verzonden via de glasvezelinfrastructuur van het grid. “Die verbindingen zijn dubbel uitgevoerd en per kanaal hebben we een bandbreedte van 10 gigabit per seconde”, zegt Trompert.

Unieke data dubbel opgeslagen
De Large Hadron Collider, een vacuüm gezogen ringvormige buis met een lengte van 27 kilometer, is gebouwd om elementaire deeltjes met hoge snelheid op elkaar te laten botsen in het zicht van een gigantische batterij meetinstrumenten. De gebeurtenissen worden van alle kanten vastgelegd met een zeer hoge nauwkeurigheid. De meetgegevens, die een schat aan kennis omtrent de aard van de materie moeten opleveren, zijn uniek: ze kunnen alleen worden opgenomen op het moment dat de deeltjes botsen. Vandaar dat de data binnen het grid redundant worden opgeslagen. De informatie die in Amsterdam op tape wordt weggeschreven, zal ook elders in de wereld worden bewaard. Alle Tier-1 centra krijgen een deel van de ruwe data plus een kopie van de data die elders staan opgeslagen.
 
Lees het hele artikel
Je kunt dit artikel lezen nadat je bent ingelogd. Ben je nieuw bij AG Connect, registreer je dan gratis!

Registreren

  • Direct toegang tot AGConnect.nl
  • Dagelijks een AGConnect nieuwsbrief
  • 30 dagen onbeperkte toegang tot AGConnect.nl

Ben je abonnee, maar heb je nog geen account? Neem contact met ons op!