Le retour du XML natif dans les référentiels
Après les tentatives infructueuses de Software AG ou d'Interwoven, Documentum mise sur une structure de stockage représentant nativement des contenus XML.
01net.
le 07/09/07 à 00h00
Documentum relance un concept que l'on croyait enterré : la gestion de contenu au format natif XML. Avec une nouvelle acquisition : celle du Néerlandais X-Hive, éditeur de la base Docato, qui assure une gestion de contenu
XML ' par composants ', spécialisée dans les documentations aéronautiques. EMC, à l'instar des éditeurs d'ECM (Enterprise Content Management), exploite depuis longtemps XML. Déjà au niveau des
métadonnées, qui deviennent de facto extensibles. Puis au niveau des contenus eux-mêmes que l'éditeur sait stocker et générer en XML.
Seulement, à la différence de X-Hive (ou de Software AG et Ixiasoft), il ne maîtrise pas leur structure. Ces contenus XML sont, au même titre que d'autres documents dans son référentiel, classiquement stockés sur un système de
fichiers.
X-Hive s'adosse, lui, à une structure hiérarchique qui connaît la syntaxe du document XML, considéré comme un assemblage de composants. Cette approche par fragments, étrangère aux éditeurs de gestion de contenu, offre des perspectives
en matière de recherche : ' Avec le langage Xpath, il est possible de cibler des requêtes sur certaines parties seulement des documents : un titre, un sous-titre, un type de
paragraphe... ', indique Joël Milgram, anciennement chez Software AG et aujourd'hui responsable de l'offre iWay chez Information Builders.
Autre perspective : réutiliser des composants à des fins de composition de documents - surtout dans le cas de contenus redondants et souvent mis à jour. Cette réutilisation est idéale pour la documentation technique. Les
éditeurs d'ECM maîtrisent eux aussi cet assemblage. Mais leur méthode se fonde sur une fragmentation rigide des documents et requiert une gestion spéciale des fragments.
Une technologie délaissée il y a trois ans
Alléchés par ces différentes promesses (auxquelles s'ajoute la publication multicanal), Software AG et Interwoven ont été les premiers à s'ouvrir à cette gestion de contenu XML... pour la délaisser il y a environ trois ans.
Aujourd'hui, EMC reprend donc le flambeau dans un contexte peut-être plus favorable : de nombreux logiciels auteurs ou standards industriels s'en remettent à XML. Et ce, qu'il s'agisse du monde structuré, semi-structuré, ou non structuré :
documents bureautiques (ODF, Open XML), finance (FPML, RiXML, XBRL)... Sans oublier les publications issues du web 2.0 (RSS, Atom, wiki, etc.).
A terme, la base de données XML de X-Hive fera partie intégrante de la plate-forme Documentum. Elle sera stockée avec ses index sur le même système de fichiers que les contenus classiques. Des requêtes XQuery seront alors exécutables
depuis la plate-forme de gestion de contenu, qui, par ailleurs, masquera le type de référentiel sollicité.
En fin d'année, Docato autorisera la gestion de contenu web de Documentum à publier des contenus directement en XML, sans les transformer en HTML ou en PDF. Pour cela, le référentiel XML devra être intégré aux services de cache et de
déploiement de site de l'éditeur.
Les deux tentatives précédentes
Software AG. En 2004, l'éditeur de la base XML Tamino s'est rapproché de Stellent, dont il assurait la distribution en France. Depuis, l'Allemand s'est repositionné sur l'intégration.
Interwoven. Lancé en 2001, abandonné en 2003, Team-XML, référentiel XML développé en interne, devait servir à la création de documentations techniques. Depuis, l'éditeur a investi le domaine de la
collaboration.
2 questions à... : Joël Milgram, responsable de l'offre iWay chez Information Builders, et auparavant chez Software AG
Quel est le risque à vouloir tout stocker en XML ?
Ce format est devenu indispensable pour déterminer les formats d'échange. Cependant, certaines données nécessaires lors de l'envoi - expéditeur, route, etc. - ne le sont plus pour le stockage. A l'inverse, lors des
traitements, des données peuvent manquer. Autre risque : le syndrome de ' babellisation '. Il intervient lorsqu'on doit casser des contenus classiques pour les stocker dans la base XML. Chacun tend
alors à inventer son propre langage de description.
Qu'en est-il des freins technologiques ?
Lorsque nous modifions ne serait-ce qu'une métadonnée, comme un commentaire, il arrive que l'empreinte calculée dans le cadre d'un contrôle d'intégrité soit, elle aussi, modifiée. Ce qui se révèle problématique dans les projets
dintégration.