Innovatie & Strategie

Analytics

Businessmodel: datamachine

7 december 2011

Het bedrijf verdient zijn inkomsten met het spelen met die data. Bijvoorbeeld door advertenties bij de juiste gebruikers voor de ogen te krijgen, maar ook tal van betaalde recruitmentoplossingen en door premium gebruikersabonnementen die toegang verschaffen tot nog meer dataopties.

Net als elk sociale netwerk is het LinkedIn er alles aan gelegen om gebruikers zo lang mogelijk op de website actief te houden. Dat betekent enorme investeringen in het ontginnen van de databerg. Immers, hoe beter en meer inzichten je gebruikers op basis van de gegenereerde data kunt verschaffen, hoe meer nut deze potentieel van de dienst ervaart en hoe meer tijd hij mogelijk spendeert op het netwerk. Met als direct gevolg de kans dat advertenties renderen. Dat spel lijkt LinkedIn goed te beheersen. Online businessuitgave eMarketer.com schat de advertentie-inkomsten van LinkedIn voor 2011 op pakweg 141 miljoen dollar, ruim meer dan drie keer de opbrengsten van 2009.

Onderste uit de kan

Manu Sharma is principal research scientist en group manager Product Analytics bij LinkedIn. “Het is ons er alles aan gelegen om het onderste uit de kan te halen op gebied van gebruikersgedrag en aanbevelingen”, zegt Sharma op Teradata’s gebruikersconferentie Partners in San Diego. “Wij doen niets anders dan nieuwe innovatieve dataproducten bouwen en inzicht halen uit de data waarmee we de business kunnen verbeteren.”

De kern van LinkedIns groei in gebruik zijn aanbevelingen. Denk aan de functie ‘people you may know’. Om zo’n populaire functie vlotjes te laten draaien, moet veel data gestructureerd worden. De schaal waarop dat moet gebeuren is ongekend. Het beroep software-engineer heeft binnen LinkedIn maar liefst 6000 variaties. En het bedrijf IBM, of de werkgever binnen deze context vaak, kent maar liefst 8000 verschijningsvormen binnen het netwerk.

Sharma schetst het toenemend belang van data science. Linked­In drijft erop. Maar het belang in de IT-industrie groeit minstens zo hard. Op LinkedIn is de trend waarneembaar dat de vraag naar het beroep data scientist enorm hard groeit.

Dagelijkse datazee

Het belangrijkste probleem bij LinkedIn op IT-vlak zit hem in de schaal van de data die continu moeten worden doorploegd. Per dag ‘cruncht’ het bedrijf maar liefst 75 terabytes aan data. Dagelijks worden bovendien 10 miljard rijen data verwerkt. Op die schaal zijn er slechts weinig ‘out of the box’-applicaties die waardevol zijn. Linked­In heeft dan ook een paar toepassingen zelf geschreven, al dan niet met behulp van open source input. Tracking is er enorm omvangrijk. Alles wat er op de site gebeurt, wordt iedere 15 minuten geüpdatet. De zelfgebouwde toepassingen Project Voldemort (gedistribueerde database) en Kafka (distributed messaging systeem) maken het mogelijk om belangrijke gebeurtenissen realtime in kaart te hebben. Zo is LinkedIn bijvoorbeeld in staat iedere reclame-impressie en klik per minuut te tracken.

Een van de op de markt beschikbare data-applicaties die wel waarde toevoegt, is de analysetool van ‘big data’-specialist Aster Data. Dat werd begin dit jaar overgenomen door Teradata en heeft naast LinkedIn ook klanten als MySpace en comScore. Aster Data kan veel grotere datasets verwerken dan de meeste beschikbare databases en weet ook raad met de analyse van ongestructureerde data; die nemen in de vorm van blogcontent en statusupdates in LinkedIn ook steeds weelderige vormen aan.

Veel van de applicaties draaiden tot voor kort op Oracle, maar volgens Sharma zit LinkedIn nu midden in een transitie waarbij overgegaan wordt naar Teradata als hart van de IT-architectuur.

Open gegevensinvoer

Andere tools de LinkedIn bij voor data science gebruikt zijn onder meer producten van Microstrategy SQL, Python, Tableau Software en Hadoop. De laatste speelt een voorname rol in het laatste dataproduct dat LinkedIn heeft bedacht: vaardigheden of skills. Vaardigheden is een containerbegrip dat kan gaan over zaken als creativiteit en hard werken tot en met concreet overweg kunnen met applicaties als Photoshop of kennis van talen als Javascript en C++. Leg dat op een gebruikersgroep van ruim 120 miljoen leden en de uitdaging wordt helder. Sharma zegt dat de kansen vanuit werkgeversperspectief enorm zijn op dit vlak, maar dat de uitdaging vanuit dataperspectief nog velen malen groter is. Vooral het standaardiseren van open invoer op die schaal speelde Linked­In parten.

 
Lees het hele artikel
Je kunt dit artikel lezen nadat je bent ingelogd. Ben je nieuw bij AG Connect, registreer je dan gratis!

Registreren

  • Direct toegang tot AGConnect.nl
  • Dagelijks een AGConnect nieuwsbrief
  • 30 dagen onbeperkte toegang tot AGConnect.nl

Ben je abonnee, maar heb je nog geen account? Neem contact met ons op!