01net Pro Entreprise informatique
Actualités gestion et logiciel informatique professionnel
Offre et recherche Emploi informatique internet
Salon conférences inofrmatique IT ebusiness 01
Le Cloud Computing
Vidéos reportage entreprise acteur informatique
Retrouvez tous les services 01Net dédiés aux professionnels !
Télécharger logiciels Pro et progiciels
Livres blancs e-commerce informatique et nouvelles technologies
Retrouvez l'ensemble des dossiers de la rédaction 01net Entreprise
Les synthèses des bonnes pratiques sur les sujets IT du moment

Big data : entre réelles avancées, recyclage et mythes

Décryptage d'un nouveau buzz qui, par certain côtés, n'a aucune originalité, et par d'autres, est assez inventif.

laisser un avis
Plus une seule discussion sur la gestion de l’information sans que remonte la notion, désormais incontournable, de big data…  Ce concept, qui vise le traitement de très gros volumes de données, a une caractéristique : il ne connaît aucune limite. Il englobe en effet tous les formats de données (enregistrements en base, documents, images, sons, fichiers, etc), jouit de capacités de stockage pratiquement infinies, réalise ses traitements en quasi temps réel et reste accessible aux utilisateurs néophytes.
L'objectif ? Donner du sens à la montagne d’informations précieuses sur laquelle sont assises les entreprises mais qu’elle délaissent, faute de moyens. Avec le big data, elles sont censées analyser des données aussi diverses que les comportements d’achat sur le web, la nature des interactions sur un réseau social, les relevés de consommations d’énergie sur les compteurs intelligents ou encore la typologie des pannes sur un réseau. 

Dans quel contexte technologique cette tendance s'inscrit-elle ?

L’effervescence autour du big data répond à la loi de l’offre et de la demande. En effet, ce mouvement est à la croisée des chemins entre un nouveau corpus d’informations (en premier lieu celles issues des réseaux sociaux) et l’apparition de nouveaux moteurs d’analyse. « En se démarquant des seules bases relationnelles, de plus en plus d’écoles de traitement de la donnée analytique prennent leur essor, indique Jean-Michel Franco, expert en décisionnel chez Business & Decision. Parmi elles, citons les bases en mémoire, celles en colonne, les datawarehouses sous forme d’appliance ou encore le stockage basé sur Hadoop. Sans oublier les moteurs de recherche. »

Quelles sont les données ciblées par le big data ?

Le big data vise à collecter des types d’informations très divers. Et c’est ce qui en fait sa principale originalité. Historiquement, l’analyse de données reste cantonnée à du décisionnel. Autrement dit, à des données au préalable nettoyées, dédoublonnées, vérifiées, bref, à des données très structurées. « Le big data s’ouvre en plus à des informations présentes à l’extérieur de l’entreprise : celles récoltées sur les mobiles, les tickets des caisses enregistreuses, les portiques et surtout, les données émanant des réseaux sociaux, et qui traduisent des affinités ou des comportements d’achat  », indique Reda Gomery, directeur BI (business intelligence) et EPM (gestion de la performance) chez Micropole-Univers. 

Quelles sont les briques du big data ?

Difficile à dire, puisque ce concept reste une idée protéiforme : tout récupérer, tout analyser. Mais, globalement, il pourrait suivre le modèle des processus décisionnels : extraction, nettoyage, stockage centralisé, analyse et restitution de l’information. Avec, concernant l’analyse, une mention particulière pour le datamining.
« Mais croire qu’un seul système puisse stocker et analyser toute la diversité des données rencontrées serait illusoire, lance Jean-Michel Franco. Les différentes technologies de bases de données correspondent à des cas d’usage bien distincts, et encore relativement confinés. » Ainsi, le stockage en mémoire est taillé pour la navigation au travers d’axes définis a posteriori, l’architecture massivement parallèle (MPP) est destiné aux requêtes particulièrement lourdes et complexes, le système de fichiers distribué du framework Hadoop concerne le stockage et la remontée de contenus non structurés, etc.

Quelles différences entre big data et décisionnel ?

A part la nature des données à analyser (peu structurées et sociales), les différences sont minimes. Globalement, le big data reprend les mêmes problématiques que le décisionnel : il cherche à se rapprocher du rythme des applications de production en livrant ses analyses en quasi temps réel. Il s’attaque à des volumétries exponentielles et s’adresse aux utilisateurs néophytes. Enfin, comme la BI, qui, depuis des années, s’évertue à embarquer des fonctions prédictives (sans grand succès, d’ailleurs), il fait la part belle à la découverte de modèles comportementaux. A se demander donc si le big data n’est pas avant tout un nouveau buzz pour reconditionner l’actuel décisionnel et lui donner un second souffle.

Quels sont les mythes du big data ?

Premier d’entre eux : l'idée d'un système à tout faire. Cela n’existe pas. Si elle doit absorber différentes typologies de données, l’architecture big data devra être composée d’une multitude de briques technologiques et non d’un seul bloc unifié.
Autre mythe, ou du moins aspect éludé : le travail de préparation des contenus. A écouter les chantres du big data, il semble inexistant. Rappelons que le principal chantier d’un projet de BI consiste à qualifier les données, s’assurer de leur véracité, les nettoyer et, si besoin, les transformer. Pourquoi en serait-il autrement ici ? Qu’elles relèvent de réseaux sociaux, de capteurs dans les espaces publics ou de documents bureautiques, ces informations devront d'abord être passées au peigne fin.
Dernière contre-vérité : l’avalanche de données est pratiquement insurmontable avec les outils actuels. Certes l’afflux de données issues des réseaux sociaux génèrera du volume. Mais gageons que celui-ci sera progressivement digéré avec l’évolution naturelle de la technologie. Ce discours inflationniste prédisant un tsunami d'informations que seul des systèmes dernier cri seraient à même de gérer a toujours existé. Le big data en est aujourd’hui l’incarnation (lire à ce sujet le billet de Decideo).

Quels nouveaux services le big data proposera-t-il ?

Un bien meilleur ciblage dans le marketing personnalisé. « Il y a dix ans, le décisionnel se focalisait seulement sur l’analyse des ventes. Puis, il y a cinq ans, il s’est mis à analyser les achats au travers du comportement des consommateurs », explique Eric Guigné, cofondateur de Polarys, SSII spécialisée dans le décisionnel. Le big data devrait donc accentuer cette dernière tendance : en ciblant, par exemple, le profil et les agissements des fans sur Facebook, il disposera de données plutôt fiables et, surtout, particulièrement fraîches. « Selon les affinités, les dates d’anniversaire, ou les lieux géographiques, une entreprise pourra donc proposer des offres sur mesure aux clients », poursuit-il.

Le big data va-t-il rajouter de la complexité au SI ?

Les DSI peinent déjà à gérer le patrimoine informationnel de leur entreprise. Si on leur rajoute des données supplémentaires, à moins d’être particulièrement bien outillés, ils devraient accuser le coup. Et pour ne rien simplifier, « se poseront également des questions d’ordre juridique relatives au respect de la vie privée lors des collectes de données », précise Réda Gomery. Lequel croit par ailleurs que le big data devrait susciter des opportunités d’investissement : « Il devrait faire prendre conscience aux organisations qu’il existe en leur sein un ensemble de données non structurées qui méritent d’être analysées pour de la prise de décision », poursuit-il. Conséquence directe sur le plan de l’infrastructure, « les entreprises mériteraient de s’ouvrir à d’autres technologies que la seule base de données relationnelle », projette Jean-Michel Franco.   
envoyer
par mail
imprimer
l'article
2 AVIS SUR CET ARTICLE
Répondre
 

Avis sur «Big data : entre réelles avancées, recyclage et mythes»

 

accuser le coup

de lang , posté le 16 septembre 2011 à 13h39
"accuser le coup", ça ne veux pas dire "surmonter l'épreuve" ?
alerter le modérateur


Cyberattaque

de Jean-Sais , posté le 05 janvier 2012 à 14h46
Si le retour à la feuille blanche et au crayon de bois!!!
alerter le modérateur

   
 
à lire aussi
SUR LES MÊMES THÈMES
Plus de 4 000 cœurs pour le dernier serveur SGI
Teradata va s’offrir eCircle
Chronozoom, le big data de l'histoire de l'univers, devient open source
Software AG cède à la vague du big data via une offre in-memory
Au cœur du big data, décryptage du phénomène Hadoop
Une boîte à outils qui requiert des compétences très différentes
Hadoop : une histoire vieille de dix ans
La technologie idéale pour analyser l'inconnu
Pourquoi tous les spécialistes de la donnée convoitent Hadoop
01 Business : les enjeux du big data
Sybase s'ouvre à l'architecture MapReduce
Comment quatre fournisseurs remixent le concept du big data
Le Big Data ne répond à aucun besoin précis
Big Data, la prochaine révolution informatique
[EMC World 2011] Concrétisation des bases de données « géantes » pour les entreprises
Jive achète Proximal Labs, une start up Big Data
Les bonnes surprises de la recherche Microsoft
Magasin du futur, e-commerce, logistique, applis mobiles : les nouveaux défis de la distribution
Tout savoir sur les futurs réseaux sans fil Gigabit Wi-Fi
Nos partenaires