Un nouveau record dans le tri de données
Grâce à un nouvel algorithme de tri, des chercheurs allemands de Karlsruhe ont pulvérisé l'ancien record du MIT.
01net.
le 17/06/2009 à 18h08
Un groupe de chercheurs allemands, issu du Karlsruher Institut für Technologie (KIT), vient d'établir un nouveau record dans le tri de données, à l'occasion de la dernière édition du Sort Benchmark, un « championnat » international et annuel de tri auquel participent tous les grands noms de l'informatique, tels que Google, Yahoo, MIT, etc.Les algorithmes de tri font partie des algorithmes fondamentaux de l'informatique et sont utilisés dans tous les domaines. Il s'agit de trier les données pour les présenter dans un ordre défini, par exemple de la plus petite vers la plus grande.
L'équipe allemande a remporté la première place dans l'épreuve reine, le GraySort Indy, où il s'agit de trier 100 téraoctets en un minimum de temps en s'appuyant sur une plate-forme technique sur mesure (c'est l'équivalent des courses de Formule 1). Leur algorithme a réalisé cela en 2 h 57, en s'appuyant sur une grappe de 195 ordinateurs, chacun équipé de deux quadriprocesseurs et d'une mémoire de 16 Go.
Trois fois plus de données triées avec deux fois moins de machines
De son côté, Yahoo a remporté l'épreuve GraySort Daytona, dans laquelle il s'agit de trier 100 téraoctets mais avec des infrastructures informatiques standards (c'est l'équivalent des courses de stock-car). Ce que la société a réalisé en 2 h 53 en s'appuyant sur un réseau de 3 452 ordinateurs, chacun équipé de deux quadricoeurs Xeon et d'une mémoire de 8 Go.
Les chercheurs du KIT ont également gagné l'épreuve Minute Indy, où il s'agit de trier la plus grande quantité de données en une minute. Avec la même plate-forme, ils ont établi un nouveau record avec 955 gigaoctets triés. Soit trois fois plus de données avec deux fois moins de machines que pour le précédent record, détenu par le MIT.