![]() |
Emploi
|
![]() |
Start-up
|
![]() |
Evénements 01 | ![]() |
Avis d'expert | ![]() |
Vidéos | ![]() |
Indicateurs
|
![]() |
Distribution
|
![]() |
Telecharger Pro
|
![]() |
Livres blancs | |||||||||||||||||||||












L'engouement pour les projets décisionnels – Business Intelligence (BI), en anglais – est sans précédent, car le volume de données produites par une entreprise double tous les cinq ans. Des données qu'il faut trier puis agréger sous la forme d'indicateurs de gestion synthétiques pour pouvoir prendre des décisions pertinentes.
“ Vous pilotez un avion de nuit. Comment atterrissez-vous sans écran de contrôle ? ”, résume Jean-Michel Bras, secrétaire général d'Aexxdis, spécialiste de la logistique des produits de santé (120 collaborateurs), qui propose des tableaux de bord métier à l'ensemble des professionnels avec qui l'entreprise travaille.
Les outils des éditeurs propriétaires – Business Objects, Cognos, Hyperion, SAS, Teradata, etc. – coûtent cher, car ils sont souvent facturés au nombre d'utilisateurs ou de connexions simultanées. Les entreprises se tournent donc vers des outils open source pour réduire les coûts de licence, de 20 à 50 % du coût total d'un projet décisionnel.
“ Nous ne nous sommes même pas intéressés aux outils propriétaires tant ils sont chers ”, illustre Frédéric Jourden, directeur marketing de Xinek (cinq employés), un service de recommandation d'achat en réseau, qui utilise Pentaho pour la restitution (tableau de bord, etc.) et MySQL pour son entrepôt de données (stockage des données). Cependant, parce qu'elles ne sont pas aussi bien finies que les suites propriétaires, “ les suites open source requièrent parfois un effort de participation du client dans le développement. Mais elles permettent en contrepartie de lui construire une solution sur mesure ”, indique Michael Bienstein, responsable BI open source chez BearingPoint et membre actif des projets olap4J et Mondrian.
Pour accélérer les déploiements, des éditeurs, tels Pentaho et Jasper-Soft, et des intégrateurs comme Engineering (SpagoBI) proposent donc des suites presque complètes intégrant ETL, moteur Olap, serveur de rapports, etc. Idem du côté des bases de données. Si PostgreSQL et MySQL ne rivalisent pas avec Teradata, elles répondent cependant aux contraintes de nombreux projets.
Propriétaire ou libre, le besoin fonctionnel de l'entreprise se résume toujours à “ disposer d'informations pertinentes pour mieux vendre et faire les bons choix stratégiques ”. Aexxdis a, par exemple, déployé un portail métier proposant des tableaux de bord aux personnes extérieures à l'entreprise et une navigation multidimensionnelle (Olap) en interne. L'ensemble du projet repose sur des briques open source : Pentaho, PostgreSQL, OpenLDAP, etc.
“ Le management capte et analyse ainsi plus rapidement l'information structurante, ce qui améliore le processus de décision en termes de qualité et de délai. Nos clients disposent quotidiennement d'une quarantaine d'indicateurs et de sources d'informations à travers un portail décisionnel sécurisé ”, détaille Jean-Michel Bras. Chez Xinek, Pentaho permet de mieux comprendre l'audience du service en ligne pour proposer des cibles à forte valeur ajoutée aux annonceurs qui rémunèrent l'entreprise en fonction des ventes générées.
Bien qu'étant un service public, le Secrétariat pour les affaires régionales de la préfecture de région Midi-Pyrénées (SGAR, 55 employés) a suivi exactement la même démarche (PostgreSQL, SpagoBi) afin que “ les préfets des huit départements disposent de tableaux de bord efficaces pour juger la performance des engagements pris dans le cadre de la LOLF ”, explique Philippe Ourliac, chargé de mission TIC au sein du SGAR.
Le projet comprend trois datamarts stockant des indicateurs pour 34 missions, 130 programmes et 50 budgets opérationnels. C'est surtout le coût des outils propriétaires qui explique son choix. “ Avec 340 contributeurs, les coûts de licence faisaient exploser notre budget. L'open source nous affranchit de ces coûts tout en augmentant notre indépendance vis-à-vis d'un fournisseur ”, résume Philippe Ourliac. A l'image de Sabre (système de réservation de voyages aériens) et de Swissport (gestion des aéroports suisses, 21 000 employés), les grandes entreprises recourent plutôt à l'open source pour rationaliser et réduire le coût de certains projets décisionnels.
“ Notre base de données Teradata était surdimensionnée tant sur un plan fonctionnel que financier. Nous avons donc opté pour MySQL ”, illustre Michael Benzinger, chez Sabre. L'entreprise a créé un entrepôt de données de plus de 4 To en trois semaines, en ne prenant en charge que le coût du matériel : 62 500 dollars au total.
De son côté, Swissport souhaitait “ réduire le nombre d'outils de reporting en interne et tirer plus de valeur ajoutée des données que nous produisons toute l'année ”, explique Uwe Geercken, son responsable informatique.
Un projet décisionnel est souvent découpé en deux lots. L'entrepôt de données (datawarehouse) agrège certaines données de production selon un schéma en étoile à n dimensions métier : client, produit, etc. Contrairement à une base traditionnelle, certaines données peuvent être dupliquées pour des raisons de performance.
La couche de restitution comprend, elle, les nombreuses briques techniques qui permettent à l'utilisateur de visualiser les indicateurs, de créer des rapports et de naviguer au sein des dimensions métier des données. Jusqu'à présent, aucune entreprise ne se lançait directement dans un projet décisionnel d'envergure en s'appuyant entièrement sur des outils open source.
Le risque technique était trop important, et, malgré leur coût de licence élevé, les outils propriétaires satisfaisaient souvent les utilisateurs en termes de couverture fonctionnelle, de stabilité et de performances. Sabre n'a donc remplacé Teradata par MySQL que pour une partie seulement de son entrepôt de données. L'entreprise continue à utiliser des outils de restitution propriétaires, “ parfaitement adaptés à nos besoins ”, explique Michael Benzinger.
De son côté, Swissport utilise Hyperion comme outil de restitution sur l'un de ses projets et MySQL pour stocker les données. L'entrepôt est alimenté par une moulinette Java “ bientôt remplacée par l'ETL open source de Talend ”, explique Uwe Geercken. Bien qu'ils soient faciles à mixer avec des outils propriétaires, les outils open source possèdent quelques particularités à prendre en compte.
“ Ils intègrent moins d'assistants, mais de plus en plus de démonstrations complètes à partir desquelles on peut démarrer son projet, note Jean-Michel Bras. Ces outils offrent des perspectives nouvelles, notamment dans le prototypage rapide des bases de données ”, ajoute-t-il. Un point de vue partagé par le SGAR. “ Il facilite le prototypage tant au niveau des données que de l'interface utilisateur ”, confirme Philippe Ourliac.
Que le projet soit propriétaire, open source ou mixte, sa mise en œuvre répond aux mêmes étapes : “ Définition des besoins fonctionnels, création du datamart [modèle en étoile, NDLR], alimentation via un ETL, restitution des informations et indicateurs au sein des interfaces choisies en fonction des utilisateurs, en accès statique et dynamique ”, énumère Jean-Michel Bras, d'Aexxdis.
Et le pragmatisme est de rigueur en termes d'architecture. “ Notre ETL transfère les données de la base de production [Oracle, NDLR], la nuit dans notre entrepôt de données [MySQL, NDLR], car nous n'avons, pour l'instant, qu'un seul fuseau horaire à gérer ”, illustre Frédéric Jourden, de Xinek.
Mis à part Swissport et Sabre qui possèdent un service informatique important, toutes les PME font appel à un ou plusieurs prestataires. Le SGAR s'est appuyé sur Altic qui possède à la fois des compétences en décisionnel (modélisation en étoile, etc.), et maîtrise les outils open source associés. Même démarche pour Xinek qui a fait appel à Smile. Aexxdis est passé par deux prestataires : Carra Consulting pour la maîtrise d'œuvre et la conception du projet, et Code Lutin pour sa réalisation.
“ Nous voulions aller vite. Or, on ne s'improvise pas expert en décisionnel open source ”, résume Jean-Michel Bras, d'Aexxdis. Son projet s'est déroulé au forfait pour éviter toute surprise budgétaire. “ Nous n'avons eu qu'à budgéter l'application et participer aux derniers réglages. Une solution efficace, confortable, avec des coûts maîtrisés ”, estime-t-il.
Aujourd'hui, pour cette entreprise, une journée/homme par mois suffit pour la maintenance technique et applicative. Elle dispose, en revanche, de bonnes compétences Java/JavaEE en interne, base de tous les outils décisionnels open source. “ Le plus difficile dans un projet décisionnel, c'est de modéliser la structure de données de l'entrepôt ”, explique Frédéric Jourden, de Xinek.
C'est en effet à ce niveau que les choix métier les plus importants ont lieu : quelles données de production conserver ou non ? Quels axes métier retenir pour le modèle en étoile ? Etc. Autant de questions qui nécessitent de monopoliser des ressources en interne. C'est pourquoi, de plus en plus de prestataires et d'entreprises privilégient un mode itératif. “ Notre projet a débuté fin 2005 et se poursuit toujours ”, illustre Jean-Michel Bras.
Quant au budget, il est essentiellement constitué des coûts de conseil, de réalisation et de production. Il est très variable selon les projets. Le projet de Xinek a, par exemple, nécessité 100 jours/homme au total (50 000 euros) pour créer trois cubes et dix-neuf rapports statiques sous Pentaho et MySQL.
Globalement, les entreprises rencontrent peu de problèmes techniques lors de la mise en œuvre des projets. En revanche, les prestataires open source spécialistes du décisionnel et les spécialistes du décisionnel utilisant des outils open source sont encore rares. Heureusement, les logiciels se démocratisent vite. A l'image d'Anaska, plusieurs organismes proposent déjà des programmes de formation, sur l'ETL open source de Talend par exemple.
De toute façon, “ les principaux écueils ne sont pas techniques, mais humains : nouveauté pour les utilisateurs, compréhension des concepts de l'informatique décisionnelle, mise au point d'indicateurs métier pertinents, etc. ”, rappelle Philippe Ourliac. “ La personnalisation d'une solution open source demande un certain engagement que les utilisateurs ne sont plus forcément prêts à faire. Ils ont pris de mauvaises habitudes avec des solutions déjà packagées ”, complète-t-il.
“ Nous estimons notre potentiel d'économies sur trois ans entre 40 et 50 % du prix d'une solution propriétaire ”, calcule Jean-Michel Bras. Autre intérêt, “ la gratuité des outils décisionnels open source permet de mettre en place des pilotes grandeur nature sans dépenser trop d'argent ”, complète Philippe Ourliac.
Un point particulièrement important avant un choix d'engagement définitif, vu l'ampleur des projets. Mais l'aspect financier n'est pas le seul avantage de ces outils. “ Ils communiquent et s'imbriquent très bien entre eux. Ce qui n'est pas le cas des outils décisionnels propriétaires ”, note Uwe Geercken, chez Swissport.
Contrairement aux outils propriétaires, les entrepôts de données et les suites décisionnelles open source ne sont pas facturés au nombre d'utilisateurs ou de connexions simultanées. Les entreprises ouvrent donc souvent leur portail décisionnel à leurs partenaires sans dépenser un centime de plus.
Des éditeurs comme Pentaho et JasperSoft proposent des suites complètes qui agrègent les briques techniques les plus utilisées (Kettle pour l'ETL, Mondrian pour le serveur Olap, etc.) au sein d'une seule plate-forme décisionnelle. Même si elle n'est pas encore au niveau des outils propriétaires, cette intégration représente un gain de temps important.
Comme c'est toujours le cas sur un marché émergent, les prestataires compétents à la fois en termes techniques (choix des outils, déploiement, intégration, paramétrage, etc.) et décisionnels (modélisation, conception, etc.) sont encore rares.
Sur de très gros volumes de données, les outils open source sont encore loin d'atteindre les performances de Teradata ou de SAS. Mais leurs performances sont suffisantes pour de très nombreux projets. Et, à l'opposé de la démarche des éditeurs d'outils propriétaires, l'ouverture des suites open source facilite la mixité entre outils propriétaires et libres.
Dépositaire pharmaceutique, Aexxdis a débuté son projet décisionnel fin 2005 pour ouvrir et compléter son progiciel métier basé sur un AS/400. Son portail décisionnel fournit des indicateurs métier (ventes, transport, stocks, commandes, etc.) aux partenaires et aux clients de l'entreprise. “ Nous avons retenu un mode projet itératif qui favorise l'adaptation et l'évolutivité de notre portail aux exigences du moment. Un portail décisionnel doit en permanence s'adapter pour répondre aux attentes des utilisateurs ”, estime Jean-Michel Bras, secrétaire général de l'entreprise.
C'est tout l'intérêt d'une solution sur mesure bâtie sur des logiciels dont le coût de licence est nul. Grâce à cette approche, “ nous pouvons consacrer un budget plus important aux fondamentaux de notre projet, à savoir les aspects métier ”, explique-t-il. Comprenant une vingtaine d'indicateurs, la première version du portail était disponible trois mois après le lancement du projet. “ Et ce nombre n'a cessé d'augmenter depuis, se réjouit Jean-Michel Bras. La navigation Olap est, elle aussi, opérationnelle. Mais nous retardons volontairement la mise à disposition en attendant que les utilisateurs soient familiarisés avec nos indicateurs ”, illustre-t-il.
Aexxdis
La préfecture de région Midi-Pyrénées a déployé un pilote basé sur SpagoBI pour faciliter la mise en œuvre de la nouvelle plate-forme de gestion budgétaire de l'Etat, la LOLF. “ Plus de 300 responsables disposeront ainsi de tableaux de bord efficaces et simples à lire afin de juger de la performance des engagements pris dans le cadre de la LOLF ”, décrit Philippe Ourliac, chargé de mission TIC. La préfecture a modélisé ses trois datamarts – utilisés par le requêteur ad hoc et les cubes Olap – en exploitant le modèle conceptuel de la LOLF et en suivant son découpage fonctionnel (missions, programmes, etc. ) et sa hiérarchie (ministère, région, département, etc. ).
Mais l'équipe de la préfecture a dû se rendre à l'évidence : “ En l'état actuel, il est impossible d'automatiser l'extraction et la transformation de ces données, ce qui oblige à une double saisie , explique Philippe Ourliac. En effet, les données de base sont fournies par des applications hétérogènes (Diren, Drass, Draf, etc. ), où chaque administration définit ses propres indicateurs de gestion. “ Notre prestataire, Altic, étudie l'ETL open source de Talend qui semble bien adapté à nos contraintes techniques. Mais c'est surtout au niveau métier qu'il faut essayer d'homogénéiser les données ”, conclut-il.
SGAR
Michaël Bienstein est responsable BI open source et membre des projets olap4J et Mondrian.
Les suites “ open source ” sont-elles aussi performantes que les suites propriétaires ?
Non, mais elles sont amplement suffisantes pour la plupart des projets. Et puis, c'est surtout au niveau de la base de données sous-jacente que l'on peut réaliser les principales optimisations : partitionnement, bitmap indexé, parallélisation des requêtes, etc. A ce stade, PostgreSQL offre des performances équivalentes à celles d'Oracle. Mais aucun SGBDR open source n'atteint les performances de Teradata.“
La gestion du langage MDX par les outils open source est-elle importante ?
Oui. MDX est à Olap ce que SQL est aux SGBDR : un standard adopté par de nombreux éditeurs, Microsoft, SAS, Hyperion, SAP, Teradata, MicroStrategy et d'autres, qui permet de changer d'outil de restitution graphique sans devoir retoucher les requêtes sous-jacentes, et qui garantit en partie la capacité de montée en charge de l'application. Sans MDX, certains projets décisionnels sont irréalisables.
Bearingpoint France
















