En poursuivant votre navigation sur ce site, vous acceptez l’utilisation de cookies pour vous proposer des services et offres adaptés à vos centres d’intérêts.FERMER  x
Pour en savoir plus et paramétrer les cookies...

Hadoop : une histoire vieille de dix ans

La boîte à outils taillée pour l’analyse d’énormes volumes de données non structurées incarne à elle seule le concept de big data. Retour sur ses origines, le rôle de Google et celui de Yahoo.

laisser un avis
Une des raisons pour lesquelles Hadoop concentre tant l’attention de l’industrie tient à la légitimité qu’il a acquise tout au long de cette décennie. Pour la petite histoire, le succès de Google lui est en partie imputable. En 2001, alors qu’il ne pèse rien sur le marché des moteurs de recherche, le futur géant développe ce qui deviendra les composants phares d’Hadoop.  « Pour stocker, traiter et indexer 5 milliards de pages web, il construit MapReduce, Google Big Table et Google File System. Il exploite ces éléments pendant trois ans, et en fait la description dans une publication académique », raconte Charles Zedlewski, vice-président produit de Cloudera, l’une des start up pionnières dans le big data.

Trois start up qui ont ouvert la voie

Doug Cutting, fondateur du moteur de recherche open source Lucene
agrandir la photo
En 2004, un certain Doug Cutting, fondateur du moteur de recherche open source Lucene, qui, à l’époque, planche sur une méthode relativement économique pour indexer en masse des pages web, s’empare des publications de Google, et crée le premier prototype d’Hadoop. Devant le succès de Google, et sa capacité à « avaler » si facilement le web, Yahoo, de son côté, cherche à investir cette technologie. Elle embauche Doug Cutting en 2006, promeut activement Hadoop, le stabilise, et va jusqu’à créer, l’année dernière (en juin 2011), une filiale dédiée à Hadoop : Hortonworks.
Entre-temps (fin 2009), le père d’Hadoop rejoint Cloudera, concurrent frontal d’Hortonworks, qui toutes deux se disputent le titre de plus gros contributeur d’Hadoop. Il faut également compter sur une troisième start up, MapR (créée en même temps que Cloudera, début 2009) qui enrichit Hadoop d’une gestion de stockage propriétaire. 
Ces trois start up ont levé plus de 150 millions de dollars en deux ans. Aujourd’hui, des géants du web tels que Facebook, Twitter, Linkedin ou eBay exploitent Hadoop, lequel, depuis décembre dernier, est entré dans sa version v1.0.0 (qui succède à la v0.22.0).
envoyer
par mail
imprimer
l'article


@01Business_fr sur
à lire aussi
SUR LES MÊMES THÈMES
Hadoop est en passe de détrôner le datawarehouse traditionnel
Le big data et la sécurité : plus de données... plus de problèmes
Oodrive rachète Active Circle, un expert du stockage big data
Comment aider le cerveau à appréhender le big data
Big Data, radioscopie d’un nouveau gisement d’opportunités pour la grande distribution
On dépensera plus en 2015 !
01 Replay : Coup de pouce à la startup Price Match
Apple et IBM nouent une alliance historique
Coupe du monde : l'Allemagne avait un douzième homme... le big data
Coup de projecteur sur les délicates -mais parfois réussies- relations entre startups et grands comptes
Le plan big data vise à créer 80 000 emplois d’ici 2020
Un milliard de données remontent automatiquement chaque jour depuis les smartphones
Deux "jobs en or" recherchés par les entreprises en 2015
Avec Dataflow, Google analyse les flux de données à la volée
La high tech, un renfort de poids pour les équipes de football
Ressources humaines : qui a peur du grand méchant big data ?
01 replay : Le big data au coeur de la transformation des banques
Big data : Intel investit 740 millions de dollars dans Cloudera
Comment rater son projet big data en 12 leçons
Le big data est difficilement soluble dans les organisations traditionnelles