Le décisionnel remet au goût du jour la hiérarchisation du stockage
Teradata introduit dans son datawarehouse une couche de virtualisation pour répartir les données sur des supports de stockage en fonction de leur fréquence d’accès ou de leur historique. Une première.
01net.
le 26/08/2009 à 16h38
Qui se souvient du concept d'ILM (Information Lifecycle Management) ? Vers 2004-2005, devant la chute des prix du gigaoctet, tous les fabricants de baies de disques ne juraient plus que par la hiérarchisation du stockage. Son principe repose sur la migration des données sur des supports de stockage adaptés à leur criticité, elle-même évoluant dans le temps. C'est l'échec. L'ILM est trop complexe à déployer, trop décorrélé des applicatifs métiers...
C'est pourtant une nouvelle forme d'ILM que Teradata décline aujourd'hui. Mais parce qu'elle sert un domaine bien précis, le décisionnel, elle devrait subir un meilleur sort. Disponible avec la V13 de son entrepôt (lancée cet été), Virtual Storage, la nouvelle couche de virtualisation du constructeur, joue sur la température des données. Les espaces chauds concernent les informations couramment sollicitées. Les espaces froids, celles peu touchées par les requêtes et souvent stockées à des fins légales. « Nous ciblons en particulier les opérateurs telco qui doivent conserver douze mois le détail des communications de leurs clients, mais qui, pour leurs analyses propres, ne ciblent que les trois derniers mois », avance Jean-Marc Bonnet, architecte au sein de Teradata.
Décorréler stockage et puissance de traitement
D'un côté donc, des disques performants de 146 Go. De l'autre des supports plus « capacitifs » de 310 Go dont le prix au gigaoctet est moindre. L'ensemble tournant dans une seule et même instance de la base Teradata. « La couche Virtual Storage se charge de la répartition physique des données selon des critères définis à l'avance », poursuit-il. Ces critères portent, d'une part, sur la fréquence des accès. Si elle dépasse un certain seuil, la donnée est transférée vers le chaud. Ils dépendent, d'autre part, des dates de création des enregistrements au-delà desquelles ces derniers migrent vers le froid.
Cette mixité du stockage, que le spécialiste du datawarehouse est le premier à proposer en BI, est censé faire baisser les prix à double titre. Déjà, on l'a vu, en exploitant des disques meilleur marché pour la simple conservation de données. Mais également en décorrélant stockage et puissance de traitement. « Jusqu'alors l'extension de disques rimait nécessairement avec l'extension de CPU. Désormais la capacité de stockage d'un entrepôt peut être doublée avec des espaces froids sans rajouter aucune unité de traitement. »
Le constructeur parle de diviser par dix le coût de ces portions froides même si la politique tarifaire de son nouveau module reste encore à définir. Plus généralement Teradata cherche à se défaire de l'image d'un fournisseur de produits de luxe aux prix inatteignables. Sa dernière innovation va certes dans ce sens, mais elle risque de ne pas suffire. D'autant qu'elle ne concerne que son datawarehouse haute de gamme (Teradata 5555).