Un anneau et une grille pour défier l'univers
Grâce au LHC, le plus grand accélérateur de particules du monde, 10 000 chercheurs vont pouvoir utiliser 144 clusters pour trouver une particule parmi des milliards de milliards. Le tout est d'abord de savoir comment s'y
prendre.
01net.
le 12/11/08 à 10h30
Le 3 octobre dernier, le docteur Wolfgang von Rüden, grand patron de l'informatique du Cern, était à deux doigts de l'euphorie. Après neuf ans d'un chantier pharaonique, impliquant plus de 500 instituts privés et gouvernementaux
et l'interconnexion de 25 000 ordinateurs sur 33 pays, il inaugurait ' sa ' grille de calcul. Cet assemblage de plusieurs clusters, géographiquement éloignés mais travaillant de concert,
permettrait de trouver le boson de Higgs, la particule qui expliquerait comment l'univers s'est construit depuis le big bang. Pour ce faire, la grille scrutera les milliards de milliards de collisions de protons qui doivent avoir lieu au c?"ur du
LHC (Large Hadron Collider ou grand collisioneur de hadrons), le plus grand accélérateur de particules au monde, enfoui à 100 mètres sous la frontière franco-suisse. Problème, le LHC est en panne. Il ne redémarrera qu'au printemps prochain, quand
l'électricité que doit fournir EDF coûtera moins cher. ' Il y a une vraie frustration. La dizaine de milliers de physiciens qui a accès à la grille a hâte de se jeter dans les calculs ', lâche Wolfgang
von Rüden. Et chacun a en tête l'espoir d'être le premier à mettre la main sur la sacro-sainte particule.
Une ambition rendue possible par le modèle distribué. Pas de favoritisme, les 600 millions de collisions qui auront lieu chaque seconde au sein du LHC sont supposées toutes se valoir. La différence de résultats ne devrait pas dépendre
des échantillons d'observations attribués à chacun des 144 clusters qui composent la grille, mais plutôt à la performance des algorithmes de recherche propres à chaque groupe scientifique. ' C'est un problème très délicat, car
on ne peut pas se permettre de récolter toutes les données produites par le LHC, soit l'équivalent de trois millions de DVD par seconde. Notre budget ne nous permet de stocker que 15 Po d'information par an, soit l'équivalent d'un DVD toutes
les quatre secondes ', explique Wolfgang von Rüden. Il l'avoue : la sélection des informations à retenir est un mélange de hasards et de prédictions obtenues par simulation. Or, ces simulations ne deviendront pertinentes
qu'au fil des observations futures.
Distribuer, une méthode à double tranchant
Par rapport à un supercalculateur localisé en un seul point, la grille présente l'avantage de répartir les coûts. ' Les 144 sites de calculs impliqués sont financés par leurs
propriétaires ', reconnaît Wolfgang von Rüden, ajoutant que l'amplitude géographique permet d'obtenir des fonds publics de niveau européen, voire international. Mais pour Marc Simon, consultant HPC (High Performance
Computing) chez SGI, cela ne signifie pas qu'une grille coûte moins cher qu'un supercalculateur. ' Au contraire ! Le développement applicatif pour maximiser les traitements autonomes est plus complexe à mettre en
?"uvre ; on s'interdit les mises en relation entre blocs de données, alors qu'elles sont naturelles dans un supercalculateur. Pire, la liaison entre deux points de la grille doit être soit spécialisée sur une très longue distance, donc chère,
soit coûter plus de temps pour communiquer ', prévient-il.
Entre les 5 000 serveurs situés au Cern pour recueillir les informations et les 144 clusters qui les traitent, 11 centres de données servent de point d'échange, en stockant pour chacun observations et résultats. Un réseau optique
privé de 10 Gbit/s relie le Cern aux centres de premier niveau, tandis que les autres se contentent au pire d'une connexion internet classique, au mieux du réseau privé français Renater (Réseau national de télécommunications pour la
technologie, l'enseignement et la recherche). Jean-François Lavignon, directeur des projets d'infrastructure HPC chez Bull, estime que la grille du LHC a une latence 1 000 fois plus importante qu'un supercalculateur et que les données y
transitent 100 fois moins rapidement. ' Nous sommes sûrs que nous devrons faire évoluer notre réseau dans les années qui viennent. Mais nous ne savons pas encore s'il s'agira de doubler les lignes ou d'augmenter les débits à
40 ou 100 Gbit/s sur les routeurs, concède Wolfgang von Rüden. Cela dépendra autant de la manière dont évoluent les expérimentations, que de ce que proposeront les industriels, que du budget débloqué. ' La grille du LHC
avance à vue...
Des chercheurs qui jouent les informaticiens
Autre difficulté, celle de faire coopérer les 10 000 scientifiques impliqués dans le projet, dont 7 000 ont un compte d'accès à la grille. ' Cela fait neuf ans que nous planchons ensemble sur un modèle
de collaboration et nous n'y sommes toujours pas complètement parvenus ', se désole Wolfgang von Rüden. Principalement, les physiciens tiennent à écrire chacun leurs logiciels. D'une part, ils revendiquent savoir mieux que
personne comment lire les données du LHC, puisque ce sont eux qui en ont élaboré les détecteurs. D'autre part, la physique nucléaire est l'un des derniers domaines où il n'existe toujours pas d'application standard. Christophe Achard, directeur de
comptes chez Data Direct Network, énumère les obstacles : ' Les chercheurs transcrivent leurs algorithmes en C ou en Fortran sans se soucier des règles d'optimisation sur le matériel qu'ils utilisent. L'impact sur la
stabilité, la performance et la maintenance n'est pas neutre. Ils courent également le danger d'utiliser des primitives qui semblent correctes à l'échelle de leur cluster, mais qui bloqueraient le programme sur l'ensemble de la
grille. '
Selon Wolfgang von Rüden, les informaticiens sont tolérés, mais uniquement pour déboguer les codes. Philippe Thierry, ingénieur d'applications HPC chez Intel, ne veut pas jeter la pierre aux scientifiques :
' Le vrai problème est qu'il n'y a en France qu'une poignée de personnes sachant développer pour une grille, soit trois ou quatre individus chez les gros constructeurs de serveurs et une ou deux personnes par labo. On est loin
de pouvoir offrir le même service que celui rendu par une SSII à une entreprise. ' Marc Simon dénonce un retard dans le système universitaire français qui, contrairement aux Etats-Unis, ne formerait pas suffisamment les
chercheurs aux plates-formes informatiques. Philippe Thierry, lui, doute de l'intérêt du modèle américain : ' Dans le domaine des sciences, il est plus courant qu'ailleurs que des chercheurs prennent l'initiative de
comprendre la solution informatique pour mieux l'exploiter. Mais ça peut-être contre-productif ; lorsque les clusters sont arrivés dans les labos, la productivité a baissé... au bénéfice des compétences Linux, qui ont grimpé en
flèche. ' D'ailleurs, beaucoup considèrent que cet accélérateur est d'abord un immense laboratoire dont les retombées les plus rapides n'auront rien à voir avec le but initialement poursuivi.
Vers des succès sans rapport avec l'objectif initial
Ainsi, l'observation des trajectoires de particules dans ce superaccélérateur pourrait engendrer d'ici à deux ans des progrès significatifs sur le plan médical, pour l'imagerie comme pour les traitements par laser. Dans le secteur de
l'informatique, surtout, la grille du LHC devrait achever de prouver que les serveurs x86 de série, qui la composent intégralement, sont meilleurs pour le calcul scientifique que les solutions à base d'Itanium. HP, qui fournit ici l'infrastructure
réseau, y trouve l'opportunité de tester en grandeur nature son projet Cinlab. Celui-ci, qui consiste à détecter les anomalies d'un réseau et à déclencher les contre-mesures, pourrait bientôt améliorer le rendement de n'importe quel centre de
données. Le stockage, qui a ici à supporter des lectures/écritures à 15 Go/s alors que les disques ne fournissent que des accès de 10 à 20 Mo/s, est également l'occasion de mettre à l'épreuve les promesses de nouveaux systèmes de fichiers
dits parallèles.
Marc Simon, consultant HPC chez SGI, attend également des progrès en matière de développement : ' Toutes les conditions sont réunies pour que les utilisateurs de la grille découvrent comment obtenir le
meilleur rendement d'une infrastructure massivement parallèle en évitant des communications qui consomment 60 % du temps machine. Cela n'a l'air de rien en dehors du contexte scientifique. Pourtant, c'est exactement le problème auquel seront
confrontés tous les développeurs lorsque, dans deux ans, le moindre serveur en entreprise aura 32 c?"urs. ' Prévu pour durer au moins trente ans, le LHC n'offre pas la garantie aux scientifiques qu'ils observeront le boson
de Higgs. Il se peut même que les algorithmes nécessaires ne soient jamais découverts ou, pire, que cette particule, pour l'instant théorique, n'existe... pas.
Des chiffres pharaoniques
300 000 milliards de protons composent chacun des rayons de particules qui circulent dans le tunnel du LHC à raison de 11 245 tours par seconde.
de 600 particules de collisions millions sont observables par seconde.
Plus de 10 000 scientifiques exploiteront les résultats produits par les quatre détecteurs du LHC pour le compte de 500 instituts ou entreprises. Mais seulement 7 000 chercheurs auront accès à la grille.
100 000 processeurs sur 144 sites dans 33 pays, c'est ce dont est composée la grille attribuée au LHC.
15 Po de données par an pendant dix à quinze ans, c'est la quantité d'informations qui sera retenue pour être étudiée par les physiciens.
65 000 tâches tournent actuellement dans la grille et ce chiffre devrait osciller entre 250 000 et 500 000 lors de l'entrée en production.
Le fonctionnement de la grille
1- Au Cern, 5 000 serveurs quadric?"urs enregistrent toutes les données issues du LHC et réduisent leur quantité d'un facteur 1/12 000 000. Toutes ces données sont conservées à vie sur des bandes.
2- Reliés au Cern par des liaisons optiques directes de 10 Gbit/s chacune, 11 centres de données stockent chaque année 15 Po dinformations issues du LHC sur des disques avec des systèmes de fichiers hautement
parallélisés. Ils communiquent entre eux par internet afin de synchroniser le stockage des résultats produits par le niveau 2 de la grille.
3- Reliés via internet aux centres de niveau 1,144 clusters de serveurs x86 contiennent chacun une portion des données du LHC. Les utilisateurs de chaque cluster utilisent sa puissance de calcul pour analyser les
données, sans avoir accès aux données stockées dans les autres clusters de la grille. Les résultats obtenus sont sauvegardés dans les centres de niveau 1.