Un processeur pouvant atteindre les 500 gigaflops/s, soit 500 milliards d'opérations à virgule flottante à la seconde ! C’est la performance obtenue par
FireStream 9170, une nouvelle puce lilliputienne de 55 nanomètres issue des laboratoires d'ATI, un spécialiste des cartes graphiques tombé dans l’escarcelle d’AMD en 2006.
Pour afficher de tels résultats, le fondeur ne s’est pas appuyé sur le multicur mais sur le
stream processing. AMD a été le premier à évoquer cette solution lors du lancement des Radeon X1800, au mois d’octobre 2005. Depuis, d’autres industriels, comme nVidia, IBM et Sony, ont décidé de s’engager sur le marché des processeurs massivement parallèles.
Une tendance qui va se poursuivre en 2008 et qui s’explique par deux raisons. Premièrement, les fondeurs sont confrontés à des contraintes techniques. Pendant longtemps, la vélocité des processeurs centraux (CPU pour « Central Processing Unit » soit « unité centrale de traitement ») a été obtenue par l’augmentation de leur fréquence de fonctionnement. Mais cette montée en puissance possible grâce à la finesse de gravure des circuits rencontre des limites. Autre contrainte la dissipation thermique. Le dégagement de chaleur produit par la montée en fréquence pose problème.
La deuxième raison est que le stream processing présente l’avantage majeur d’être un supercalculateur bon marché dépouillé de toute structure complexe. C’est le cas du GPU Computing Tesla C870, de nVidia. « L’architecture massivement parallèle des puces graphiques (héritée de la 3D) offre des gains de performances/watts qui sont 400 fois supérieurs à des architectures CPU classiques sur des algorithmes parallèles », indique Stéphane Quentin, responsable des relations de presse produits pour l’Europe du Sud de nVidia.
Ces unités de calcul considérables sont destinées à des entreprises qui ont besoin d’importants calculs parallèles, mais qui ne peuvent se satisfaire d’un processeur généraliste ou qui n’ont pas les moyens de s’offrir un supercalculateur. Cela va aussi bien de l’analyse financière à la géophysique (pour l’exploitation pétrolière et gazière), en passant par les simulations médicales et météorologiques. Cette solution pourrait être exploitée par certains services hospitaliers.
Simuler un seul neurone représente l'évaluation de 200 millions d'équations différentielles par seconde.
D’autres secteurs pourraient être également intéressés au fur et à mesure de l’amélioration de cette solution.
« Aujourd’hui, un GPU G80 dispose d’une puissance de 500 gigaflops/s. Toutefois, nous offrons une technologie qui permet de mettre en parallèle de nombreux G80, et nous doublons la puissance tous les ans », précise Stéphane Quentin.
Tout le monde ne mise pas sur le
stream computing. Ainsi, Intel n’a pas de prévu de produire ce genre d’accélérateur de calcul d’ici à 2008. Il préfère mettre en avant
Polaris. Equipé de 80 curs, ce processeur expérimental a déjà permis d’atteindre une puissance de calcul de 2 téraflops. En combinant 300 Polaris, le cluster obtenu dépasserait même le deuxième supercalculateur au monde, le BlueGene/P, installé en Allemagne, qui atteint 167,3 TFlop/s. Des puissances aujourd'hui hors d'atteinte du
stream computing, et hors de prix.