La qualité de données s'invite dans l'ETL

Cantonnés, à l'origine, à des besoins spécifiques tels que les campagnes marketing, les outils de qualité de données sont de plus en plus sollicités pour améliorer les informations échangées entre les progiciels.
envoyer
par mail
imprimer
l'article
partager sur Viadeo
partager sur Facebook
partager sur LinkedIn
partager sur Scoopeo
partager sur Technorati
partager sur Digg
partager sur Delicious
partager sur Google
partager sur Myspace
partager sur Yahoo!

Les faits

Talend, éditeur de solutions d'intégration open source, lance Talend Open Profiler. Il suit ainsi la trace des grands éditeurs de logiciels d'intégration et de business intelligence qui se sont doté, à coups d'acquisitions, de solutions de qualité des données.

L'analyse

Les outils de gestion de la qualité de données connaissent un fort développement dans les entreprises et les acquisitions se sont multipliées chez les éditeurs spécialisés. En janvier 2006, Informatica faisait l'acquisition de Similarity Systems, qui avait lui même pris le contrôle d'Evoke Software quelques mois plus tôt. Depuis, l'éditeur a encore renforcé son offre qualité de données avec le rachat, il y a deux mois, d'Identity Systems, une filiale de Nokia spécialisée dans la vérification des identités. Business Objects (BO) est devenu un acteur majeur de ce marché par l'acquisition de Firstlogic et de ses 2 500 clients en 2006, puis celle de Fuzzy ! Informatik. En avril dernier, BO intégrait son offre ETL Data Integrator avec Data Quality, son logiciel de qualité des données : “ Une même personne qui va déployer un flux d'intégration pourra activer les algorithmes de nettoyage de données sans apprentissage nécessaire ”, affirme Pascal Floch, directeur commercial Europe de l'offre gestion de l'information chez SAP/Business Objects.

Une frénésie capitalistique qui traduit un regain d'intérêt des entreprises. Gartner attribue à ce marché une croissance annuelle soutenue de 17 % sur la période 2006-2011. Un potentiel qu'évoque Marc Daverat, responsable Emea de Dataflux : “ La plupart des entreprises n'utilisent la qualité de données qu'à l'occasion d'une campagne marketing ou pour une application précise, de type SFA ou CRM. Seules 5 % d'entre elles ont mis en place une politique de gouvernance de leurs données. ” Bruno Labidoire, directeur technique d'Informatica, souligne : “ Sur des projets purement décisionnels, la qualité de données présente un intérêt moindre, mais sur des projets de migration de données opérationnelles, elle est essentielle. ”

Des solutions open source

En marge de ces éditeurs, une offre de logiciels libres émerge. Arrah Technology, eobjects.dk ou Infosolve Technologies proposent de telles solutions et viennent d'être rejoints par Talend, qui fournissait des fonctions de nettoyage de base au niveau de son ETL. Il dévoile Open Profiler, “ un outil travaillant en amont sur les données, qui opère une analyse statistique et qui aidera à comprendre où les informations ont besoin d'être améliorées ”, indique Bertrand Diard, président de Talend. Une annonce qui précède le lancement d'une plate-forme intégrée mariant l'ETL, ce module de profiling et des fonctions de nettoyage plus sophistiquées.

L'avis du DSI : Justin Ziegler, Priceminister.com

“ Talend dispose de nombreux atouts ”

“ Talend arrive sur le secteur, déjà très compétitif, de la qualité de données avec une offre open source, ce qui en fait un cas rare sur ce marché. Il est probable que cette caractéristique soit l'un des gros atouts de cette offre. En effet, les plus grandes réussites de l'open source se situent au niveau des outils et services d'infrastructure. L'utilisateur y est à la fois le client et l'opérationnel en charge du paramétrage et du bon fonctionnement de l'outil. Qui plus est, il a souvent des compétences de développeur. C'est le cas pour les projets Apache, Eclipse, JBoss, Tomcat… L'utilisateur est donc très bien positionné pour améliorer de façon pertinente l'outil auquel il recourt tous les jours. Mieux, c'est la recette idéale pour créer un “ affect ” fort entre le développeur et son environnement de travail, où il a envie de bien se sentir. Il n'est donc pas étonnant que le modèle open source de Talend ait déjà fait ses preuves avec son outil phare Open Studio. ”

“ Reste-t-il encore de la place pour innover ? ”

“ On pourrait cependant reprocher à Talend de ne pas s'intéresser formellement à l'amélioration de la qualité de la base de contacts ou de prospects, ou encore des adresses de livraison. C'est de là que viennent, en effet, la majeure partie des produits de qualité des données. Mais quel serait l'intérêt de faire un produit équivalent aux autres sur un secteur déjà bien rempli ? Reste-t-il encore beaucoup de place pour innover sur le marché de la qualité de l'adresse postale ? J'ai l'impression qu'il est plus utile de travailler sur les manques bien réels des produits existants, et ceci d'autant plus que l'offre de Talend est open source, voire gratuite. C'est donc un candidat idéal pour venir enrichir des outils déjà en place. ”

publicité
à lire aussi
SUR LES MÊMES THÈMES
Sopra résiste dans l’Hexagone
L’offre payante de Talend disponible en mode Saas
Steria hérite du projet de paie interarmées
Talend se projette en industriel de l'infrastructure
Les nouveaux territoires du MDM
Les ETL motorisent les plates-formes décisionnelles
AMQP rajeunit la messagerie interapplicative
Dunkerque confie ses interfaces à l'EAI iBolt
Les événements complexes au cœur du SOA
RFI orchestre ses flux radio avec Biztalk
Tibco se lance dans la quête du temps réel
Oracle fanfaronne à nouveau autour de Fusion Middleware
L'ETL de Talend accessible à la demande
Le décisionnel au service des processus
Quand la ToIP se met au courant sur Ethernet
Phildar choisit un progiciel pour refondre son réseau de distribution
Quand un EAI léger marque la première étape dans un projet d'urbanisation
La fibre optique peu accessible aux PME
Comment lutter contre le paradoxe des TIC