En poursuivant votre navigation sur ce site, vous acceptez l’utilisation de cookies pour vous proposer des services et offres adaptés à vos centres d’intérêts.FERMER  x
Pour en savoir plus et paramétrer les cookies...

Le Museum national d'histoire naturelle fait rimer botanique et numérique

Avec ses dix millions de spécimens, son Grand Herbier constitue un patrimoine unique. Désormais en partie numérisé, il va permettre de faire avancer la science.

Les yeux rivés sur son écran d'ordinateur, Anne-Sophie scrute la photo d'une plante. C'est une Silene bupleuroides, espèce à fleurs prélevée en Turquie. Ses yeux balayent la planche sur laquelle quatre étiquettes manuscrites ont été successivement collées depuis plus d'un siècle. Elle décrypte patiemment l'information qu'elle cherche : “ Collines incultes de la vallée de Djimil (Lazistan), 2 000 mètres d'altitude. ” Puis renseigne le champ “ localité ” à côté de la photo du végétal. Ce la fait vingt minutes qu'elle surfe sur Lesherbonautes.mnhn.fr, le site lancé fin 2012 par le Museum national d'histoire naturelle (MNHN). Elle y revit les voyages et les découvertes de l'explorateur français Benjamin Balansa (1825-1891). Surtout, à travers ce parcours ludique et pédagogique, elle contribue, avec une centaine d'autres passionnés de sciences naturelles, à enrichir la gigantesque base de données du Museum. C'est le principe du crowdsourcing, ou participation collective des internautes, appliqué à la botanique.
Seconde jeunesse. Entre 2010 et 2012, à l'occasion de la modernisation de son Grand Herbier, le MNHN, dont le siège historique est situé au Jardin des Plantes, à Paris, a numérisé plus de six millions de plantes, jusqu'alors conservées sur des planches de papier. Seuls les échantillons phanérogames (aux organes sexuels apparents) ont été traités. Trop fragiles, les quatre millions de spécimens cryptogames (aux organes sexuels cachés) ont été conservés en l'état. Cette digitalisation a poursuivi plusieurs objectifs. Il fallait d'abord assurer la pérennité de cet herbier, soumis aux risques physiques (incendies, inondations…) et à la détérioration naturelle des échantillons.
Mais ce n'est pas tout. “ Le passage au numérique augmente le potentiel de recherches scientifiques, explique Henri Michiels, le directeur des systèmes d'information du MNHN. Désormais, les chercheurs accèdent en ligne - et en quelques heures - aux images des spécimens qui les intéressent, alors qu'il leur fallait plusieurs jours auparavant. ” Gain de temps, mais aussi d'argent, puisque les scientifiques, où qu'ils soient dans le monde, n'ont désormais plus à se faire expédier les planches de leur choix. Enfin, suite au Sommet de Rio de 1992, les pays du Nord ont l'obligation de mettre à disposition des pays du Sud les spécimens qu'ils y avaient récoltés. “ Cette rétrocession d'une partie de ce patrimoine peut se faire par Internet ”, assure le DSI.
Stockage à deux vitesses. Pour accueillir les données numérisées, le Museum a dû renouveler son système de stockage. En effet, la quantité d'informations engendrées par ce chantier dépassait les 300 téraoctets, et la simple extension de l'infrastructure existante aurait coûté trop cher. L'établissement a donc redéfini ses besoins : “ Nous n'avions pas de contrainte de performance, ni de disponibilité ”, explique Henri Michiels, pour qui ces caractéristiques sont l'apanage des solutions haut de gamme, donc coûteuses. “ En revanche, nous ne devions perdre aucune donnée, car chaque collecte est unique ! ” Afin de réduire les coûts au maximum, le DSI n'a pas voulu d'un système uniquement basé sur des disques durs. Entre leur propre fonctionnement et la climatisation nécessaire, ils auraient été beaucoup trop énergivores. “ Nous avons donc opté pour une solution hybride combinant des bandes magnétiques, qui ne nécessitent pas de réfrigération et consomment peu d'électricité, avec des disques durs qui donnent un accès rapide aux données les plus consultées ”, détaille le DSI. Ces deux supports permettent d'envisager un stockage à deux vitesses. Autrement dit, chaque information numérisée est copiée sur disque (pour être consultée) et sur bande (pour être sauvegardée). Au bout d'un certain laps de temps, si elle n'a pas été demandée, elle est copiée sur une seconde bande, puis effacée du disque.
C'est avec ce cahier des charges que l'établissement a lancé son appel d'offres. Cinq entreprises ont répondu : Quantum, SGI -avec leurs propres solutions -, ainsi que trois intégrateurs qui proposaient des combinaisons d'éditeurs et de fournisseurs de matériels de stockage différents. Les prix des solutions oscillaient entre 100 000 euros (pour 50 téraoctets de stockage) et 300 000 euros (pour 550 téraoctets). Ultraperformantes, mais aussi les plus chères, les offres de Quantum et SGI ont été écartées. C'est l'intégrateur Cefi qui a remporté le contrat, s'engageant à fournir une capacité de 170 téraoctets répartie sur des serveurs et des baies de stockage Dell et des librairies de bande LTO. Surtout, l'intégrateur a couplé ce matériel à la solution logicielle du français Active Circle, transformant l’ensemble de ce stockage en un espace virtualisé et sécurisé. La fonction de stockage hiérarchique entre disques et bandes permet en effet au Muséum d'appliquer sa stratégie de gestion des données. De plus, il était le plus intéressant financièrement (moins de 200 000 euros). Parallèlement, le chantier de la numérisation du Grand Herbier a été lancé. Le site où sont entreposées les 6 millions de planches devant être rénové, son contenu a été déplacé dans un hangar de 1 000 mètres carrés, à 40 kilomètres de Paris.
Numérisation à la chaîne. Là, trois chaînes de numérisation ont scanné les planches, à raison de 60 000 images par semaine. Pour chacune d'entre elles, deux versions ont été créées. L'une, de 50 mégaoctets (en haute définition), est réservée aux chercheurs. Elle est enregistrée sur bande magnétique, mais n'est pas intégrée au nouveau système de stockage. L'autre, de 5 mégaoctets, se trouve sauvegardée sur la nouvelle infrastructure. Le processus de numérisation et d'étiquetage des planches a représenté un budget de 500 000 euros. En y ajoutant le coût du stockage, le budget dévolu au numérique n'a représenté qu'une petite partie des 24,5 millions d'euros consacrés à la modernisation du Grand Herbier (rénovation du bâtiment, logistique, fournitures…).
Désormais, le MNHN va progressivement accueillir les versions numériques de tous les herbiers de France (Lyon, Montpellier…), et continuer de compléter les informations propres à chaque plante grâce aux internautes. Surtout, de nouvelles façons d'utiliser ces données vont voir le jour. “ Reconstitution de spécimens en images de synthèse, création de répliques grâce à des imprimantes 3D  les applications directes sont nombreuses ”, témoigne Henri Michiels. Mais dans un premier temps, cette numérisation de masse permettra de percer le secret de certaines espèces en effectuant corrélations et calculs statistiques. De quoi inciter les passionnés comme Anne-Sophie à d'autres longues heures de surf.

Les chiffres clés

700 000 euros pour numériser et stocker les planches du Grand Herbier
6 millions de plantes répertoriées
170 téraoctets de stockage

François Philippe (CEFI pour l'île-de-France) : "Les fichiers ont été créés pour durer"

Le Museum national d'histoire naturelle est un établissement public aux contraintes budgétaires fortes. Dell, dont la politique tarifaire est attractive, est un fournisseur de matériel très bien positionné sur le secteur de l'éducation et de la recherche. En faisant fonctionner ses serveurs avec le logiciel de stockage Active Circle, édité par la start up française du même nom, nous arrivions à une solution compétitive pour ce type de projet. En plus de l'aspect financier, le choix d'une solution ouverte importait pour faciliter la lecture des informations. Dans une centaine d'années, les données devront en effet toujours être facilement accessibles. Les fichiers des plantes numérisées ont donc été sauvegardés au format TAR, et peuvent ainsi être ouverts sur n'importe quel type de matériel.

envoyer
par mail
imprimer
l'article


@01Business_fr sur
à lire aussi
SUR LES MÊMES THÈMES
Citroën généralise la tablette tactile pour l'accueil du client en SAV
Opération tablettes pour tous, Société Générale accélère sa transition numérique
Auchan va généraliser le paiement mobile dans ses hypers
100 % digital, 3Suisses se donne deux ans pour être rentable
Decathlon accélère la révolution numérique dans ses magasins
La Caisse d’Epargne rode son agence « nouvelle définition »
Google Glass : Nexity lancera la première appli immobilière en France
Dans les coulisses de l'usine logicielle de Voyages-sncf.com
Etam connecte ses nuisettes
McDonald’s muscle sa stratégie numérique en s’inspirant de la France
Airbus : des robots collaboratifs constructeurs d'avions bientôt en test
Wi-Fi et NFC dans les magasins Ikea
7000 internautes réussissent à numériser les déclarations des parlementaires.
Airbus se dote de centre de calcul en "conteneur" à Toulouse et Hambourg
Comment Darty augmente ses ventes grâce au numérique
iDTGV modernise l'accueil client avec une flotte de smartphones Android
01 Replay : Zoom sur les dispositifs Coupe du Monde du PMU
Le PMU parie sur le numérique pour rajeunir ses points de vente
Une appli pour évaluer notre comportement au volant
Allianz propose des services de «conduite connectée» avec TomTom