tests
 Les dossiers
Interview exclusive : tout sur le supercalculateur GPU français
 Rédigé par le 16 juin 2008
imprimer Téléchager en pdf

Présentez-nous donc cette machine que prévoit GENCI, en passant par l'initiative du passage au GPU pour le calcul intensif. Pourquoi, comment, quand ?

S.R. : L'idée, c'est que depuis deux ans effectivement, le monde du calcul intensif regarde de plus en plus la thématique des accélérateurs de calcul comme les GPU, mais aussi des processeurs Cell et des coprocesseurs FPGA et d'autres matériels à fort potentiel. La problématique, c'est qu'on voit que la performance globale des processeurs augmente, mais celle de chaque coeur unitaire reste plutôt plate. Donc, les gens qui veulent aller au-delà de ça commencent à se dire qu'un GPU peut servir à accélérer des petits bouts de code d'applications, pour permettre d'aller largement au-delà de ce que les processeurs actuels nous offrent.

Beaucoup d'utilisateurs commencent donc à faire des tests, industriels et académiques, en France on trouve typiquement le CEA ou Total et l’IFP dans le pétrole, qui ont déjà fait pas mal d'essais pour évaluer le potentiel de ces accélérateurs là. On en est là pour le moment, on n'a
encore aucun code complet en production qui tourne, il faut le savoir, mais la recherche regarde comment on peut intégrer ces GPU en complément des moyens traditionnels.

Donc en l'état, il n'y a pour le moment pas de plan pour avoir un cluster 100 % GPU, c'est seulement du complément spécifique. Actuellement, les GPU n'adressent qu'un faible pourcentage d'applications, qui certes, va croître de plus en plus, mais il reste encore beaucoup de limites à dépasser, notamment les transferts de données entre les GPU et les CPU, la quantité de mémoire vive dont dispose les GPU (certaines applications scientifiques demandent plusieurs dizaines à centaines de Go de RAM), la correction ECC et la gestion des calculs en double précision, etc.  Ces limites matérielles associées à des contraintes algorithmiques font que toutes les applications ne se prêtent pas encore à ce type d'accélération.

NVIDIA Tesla GT200
Un module Tesla GT200 de NVIDIA, quatre GPU, au format 1U.

Le supercalculateur que nous allons mettre en place pour le CCRT, est composé à la fois de CPU et de GPU, et sera fourni par Bull. On compte 12 serveurs de service et 534 serveurs de calculs composés chacun de deux cartes mères biprocesseurs équipées de Nehalem EP quadricoeurs de chez Intel, estimés à 3 GHz. On compte donc 1068 noeuds de calcul, plus 24 noeuds de service, et donc 2184 processeurs Nehalem, pour un total de 8736 coeurs, avec 3 Go de RAM par coeur (soit 26 To de RAM DDR3 au total, NDLR).

Une partie de ces serveurs sera connectée à 48 clusters de calculs Tesla de NVIDIA via une interface PCI-Express 2.0. Dans chaque serveur Tesla, il y aura quatre GPU de la génération du GT200. Chacun de ces GPU offrira très certainement 240 unités de calculs, et chaque serveur Tesla est évalué à 800 W de consommation environ. Chaque GPU disposera de 4 Go de mémoire vive GDDR3, soit 16 Go par noeud Tesla.

La totalité des nœuds de calculs et des serveurs GPU est installée dans des racks refroidis par eau mis au point par BULL.

Il faut savoir que la partie GPU de la machine sera installée en milieu d'année prochaine, après la partie CPU, on aura donc certainement une nouvelle révision du GT200 dans nos serveurs Tesla. Le supercalculateur sera situé dans la salle des machines du CCRT, à Bruyères-le-Châtel.