La panoplie antisinistre gagne en sophistication et perd en élitisme
Réseaux à haut débit, sauvegarde continue, copie instantanée et virtualisation ont servi les outils de continuité et de reprise d'activité. Ces évolutions techniques ont permis de progresser sur le plan de la richesse
fonctionnelle et de l'efficacité tout en s'ouvrant aux moyennes entreprises.
01net.
le 14/05/08 à 07h00
sommaire
Voir tout le sommaire
Elles sont loin les années 90, quand le marché de la protection contre les sinistres informatiques voyait se concurrencer IBM et EMC avec leur logiciel de réplication respectif, PPRC et SRDF. Ces dernières années ont été
propices à l'explosion de l'offre avec l'émergence de nouveaux acteurs, mais aussi à la diversification des solutions de protection. La baisse des coûts télécoms et la généralisation des technologies de virtualisation ont favorisé l'émergence de
solutions compatibles avec les capacités budgétaires des entreprises de taille moyenne. Ce changement drastique du paysage de la tolérance aux sinistres affectant l'informatique ne remet pas en cause la sauvegarde de données en tant qu'outil de base
du PRA. La vénérable cartouche de sauvegarde que l'on stockait dans un coffre-fort ou le bunker d'un prestataire a pris un coup de vieux. Il est vrai qu'en ces temps de consolidation, il devient difficile de tolérer un même niveau de risques pour
les serveurs centralisés que pour les anciens serveurs départementaux.
L'essor de la sauvegarde de données en continu
Voilà pourquoi, après s'être lancé dans une démarche de consolidation, beaucoup viennent à reconsidérer leur plan de secours et se tournent vers la télésauvegarde. Ce type de solutions, proposée sous forme de services
externalisés ou à installer en interne, connaît un essor notable. Pour preuve, l'actuel renforcement de la présence européenne de la société Evault, spécialiste américain dont les solutions font l'objet d'accords OEM avec d'autres prestataires tels
que Sungard et IBM. Employée seule et dans ses formes conventionnelles, la sauvegarde n'est pas capable de répondre à des objectifs de reprise ' agressifs ' puisqu'il faut compter sur des RPO (Recovery
Point Objective) et RTO (Recovery Time Objective) typiques de vingt-quatre heures ou plus. Néanmoins, deux innovations techniques, la sauvegarde de données en continu (ou CDP) et la copie instantanée (de type
" snapshot "), employée dans le cadre de procédures de protection quasi continues de données, améliorent grandement l'efficacité de la reprise des données.
Emanant à l'origine de jeunes pousses, la sauvegarde continue a séduire les grands éditeurs qui l'ont mise à leur catalogue. Certains ont agi de la sorte suite à un rachat, comme NetApp avec Alacritus en 2005 ou, récemment,
Double-Take Software qui a acquis Timespring pour compléter son portefeuille de solutions PRA jusqu'alors basées sur son outil de réplication éponyme. La dynamique du marché est telle qu'elle pousse les éditeurs à renforcer la synergie entre les
fonctions conventionnelles de sauvegarde, la sauvegarde continue, les techniques de copie instantanée et de réplication. La solution de continuité opérationnelle Recovery Management de CA combine ainsi ARCserve (sauvegarde), Ca XOsoft Replication
(réplication asynchrone) et CA XOsoft High Availability (redémarrage automatique sur le site de secours).
Quant aux technologies de réplication proprement dites, qu'elles soient de type " SAN à SAN " ?" proposées par les fabricants de systèmes de stockage d'entreprise et par des
éditeurs de gestionnaires SAN tels que Datacore ?" ou " serveur à serveur " ?" comme Double-Take et Symantec ?", ou même poussées sous forme
" d'appliances " ?" tels que celles de Falconstor et de LSI ?", elles continuent de gagner en flexibilité et en efficacité. Elles supportent les modes de réplication synchrone et asynchrone et
sont déployables sur des systèmes de stockage hétérogènes. Elles acceptent aussi différentes technologies de disques : à haute performance (Fibre Channel), pour les réplications synchrones, et plus économiques (de type Sata) pour les
réplications asynchrones.
Un moteur technologique : la virtualisation
Dans le haut de gamme, les capacités de gestion des interdépendances applicatives des logiciels de réplication ont été renforcées, mais aussi couplées avec des outils de redémarrage automatique. C'est le cas de l'offre IBM Total
storage Continuous Availability qui associe des fonctions de réplication locale et distante, avec le gestionnaire de grappes de systèmes multiprocesseurs, HACMP (High Availability Cluster Multiprocessing). En entrée et en milieu de gamme, il a été
tiré parti des protocoles IP et iSCSI pour proposer des dispositifs de réplication asynchrone bon marché. Datacore, en complément de son gestionnaire SANSymphony, propose ainsi une option de réplication AIM (Asynchronous IP Mirror). SANsymphony,
gère par ailleurs la réplication synchrone sur Fibre Channel aussi bien qu'iSCSI. L'amélioration des technologies de transfert asynchrone a même été effectuée pour s'approcher des niveaux de performance des solutions synchrones sans en avoir les
inconvénients. Cela a demandé de mettre au point, comme dans le cas de la solution Universal Replicator de HDS, des techniques de ' pull ' de données visant à décharger le site de production du
traitement des opérations de réplication, ou d'implémenter des mécanismes de protection transactionnelle.
C'est ainsi que NetApp, qui disposait déjà avec Metrocluster et Snapmirror de solutions de protection dédiées à ses systèmes NAS et SAN, s'est offert, grâce au rachat de Topio fin 2006, une troisième solution : ReplicatorX.
De type quasi synchrone, elle réplique les mises à jour au fil de l'eau et garantit la cohérence des données par un mécanisme d'horodatage des transactions. Dans le même esprit, Double-Take avait conçu son logiciel de réplication asynchrone sur la
base d'une technique dite de ' transfert séquentiel ' s'appuyant sur des mécanismes de marquage des paquets de données et de ' roll-back '
transactionnel.
Cette effervescence technologique a eu un catalyseur important : la virtualisation. En favorisant la consolidation des systèmes centraux, les techniques de virtualisation appliquées au serveur et au stockage ont facilité la
conception et la mise en ?"uvre de solutions de protection. S'il est aisé de répliquer des images de serveurs virtuels, c'est que ces dernières sont généralement stockées sur une baie de consolidation SAN. S'il est possible de s'affranchir de
l'hétérogénéité des matériels de stockage, entre site primaire et site de secours, et s'il est plus facile de tester des dispositifs de protection sans influer sur la production, c'est aussi grâce à la virtualisation. Et si l'on peut viser des
délais maximaux de remise en service (RTO) d'au plus quelques minutes, c'est aussi parce qu'il est aisé de basculer d'un environnement virtualisé à un autre.
Il a fallu pour cela que les éditeurs d'outils de réplication coopèrent avec les spécialistes de la virtualisation, à commencer par VMware qui s'apprête à entrer sur le terrain de la restauration grâce à SRM (Site Recovery
Manager), attendu pour cette année. Cela l'a amené à collaborer avec des partenaires tels qu'EMC, IBM, HP, NetApp, Double-Take ou HDS. Résultat des courses : il devrait être possible d'employer SRM en tant qu'outil d'orchestration central des
plans de PRA pour automatiser la reprise des serveurs de secours virtuels, mais aussi pour piloter les outils de réplication d'origine tierce de façon à basculer sur les volumes de données appropriés. En définitive, c'est au travers de telles
synergies que la mise en ?"uvre de solutions PRA complètes et interopérables pourra être facilitée. Et viser des objectifs de reprise RPO et RTO ambitieux ?" et économiquement abordables ?" qui, jusqu'à peu, étaient l'apanage des
solutions haut de gamme.
2 questions à... : François Tête, directeur associé de Devoteam
Quelles sont les étapes d'une démarche PCA-PRA ?
' On établit l'expression des besoins et la cartographie des métiers essentiels. On essaie aussi de déterminer les durées maximales d'interruption et les pertes de données admissibles. Il convient d'évaluer le
nombre de personnels nécessaires à la restauration. Le plan qui sera lancé devra ensuite être maintenu en condition, ce qui n'est pas une mince affaire, puisque l'entreprise évoluant les facteurs de criticité vont changer. '
Existe-t-il une approche méthodologique ?
' Nous proposons Parad, une solution disposant d'un client web. Elle formalise et partage l'expression des besoins. Ce logiciel propose un canevas pour construire des plans de reprise des ressources, mais
aussi pour en piloter l'exécution. Parad intervient également pour la gestion des tests de maintien en condition opérationnelle. '
L'avis de l'expert : Michel Alliel, directeur des solutions de stockage chez HDS France
' En théorie, la démarche PRA demande de définir des classes de services '
' Cela de façon à identifier le c?"ur de métier sur lequel redémarrer avec, au plus, quelques pertes de données. C'est ce que font certains clients qui ne pourraient pas redémarrer avec un RTO important. Ils
réduisent la taille du c?"ur de métier sur lequel repartir, séparent volumes de test et de production et mettent en ?"uvre plusieurs niveaux de reprise : sur disques rapides, et sur des disques moins performants et des bandes
magnétiques. '
' Dans la vie réelle, bien des entreprises cherchent à tout répliquer '
' Effectivement, il est plutôt compliqué de définir les niveaux de reprise. Une entreprise qui a fait l'objet de nombreuses fusions ou de rachats peut aisément accomplir cette démarche car ses applications sont
isolées les unes des autres. Dans certains métiers, en revanche, une classification de cet ordre va nécessiter de réaliser l'inventaire de milliers dapplications ainsi que de leurs interdépendances. '