Seminar/2009-12-02

From LRDE

Mercredi 2 décembre 2009, 14h-16h30, Amphi 4


Le processeur CELL : architecture et programmation

Jean-Luc Lamotte

Le processeur CELL BE développé par le consortium IBM, Sony et Toshiba a eu un impact important dans le monde du calcul scientifique mais aussi dans le monde du jeu. Il est le processeur de base de la première machine à avoir atteint 1 Pflops et aussi celui de la Play Station 3 de Sony. Pour arriver à ce niveau de performance, il intègre 9 coeurs hétérogènes interconnectés par un bus. Le coeur principal (PPE) appartient à la famille des PowerPC. Les 8 autres coeurs (SPE) sont spécialisés pour le calcul. Après une présentation détaillée de l'architecture du processeur, nous développerons son mode de la programmation : lancement de threads de calcul sur les SPE, échange de données, programmation SIMD.

Jean-Luc Lamotte est professeur à l'université P. et M. Curie (UPMC). Ses travaux de recherche au sein du laboratoire d'informatique de Paris 6 (LIP6) dans l'équipe PEQUAN (PErformance et QUalité des Algorithmes Numériques) du département CALSCI (calcul scientifique) portent sur le calcul haute performance en intégrant la vitesse de calcul, mais aussi la qualité numérique des résultats obtenus. Il enseigne notamment le parallélisme dans la spécialité SAR du master d'informatique de l'UPMC.

http://www-pequan.lip6.fr/~lamotte/



La méthode multipôle rapide sur le processeur Cell : calcul du champ proche

Pierre Fortin

La méthode multipôle rapide (Fast Multipole Method, FMM) permet de résoudre en temps linéaire le problème à N-corps, en astrophysique ou en dynamique moléculaire par exemple. Nous présentons ici l'implémentation sur le processeur Cell du calcul du champ proche de la FMM, ce qui constitue un premier pas vers une implémentation complète de la FMM sur ce processeur. Nous détaillerons les problèmes rencontrés, au niveau de l'architecture comme au niveau de l'algorithmique, ainsi que les diverses optimisations mises en place. Notre implémentation permet de calculer jusqu'à 8,5 milliards d'interactions par seconde (115,8 Gflop/s) sur un processeur Cell, et jusqu'à 17 milliards d'interactions par seconde sur un IBM QS20 (230,4 Gflop/s), pour des distributions uniformes ou non uniformes de particules.

Pierre Fortin est maître de conférences à l'Université Pierre et Marie Curie dans l'équipe PEQUAN (LIP6) depuis deux ans. Ses travaux de recherche portent sur le calcul scientifique parallèle haute performance et sur les simulations numériques pour le problème à N-corps. Depuis septembre 2009, il est responsable de l'option "Calcul Intensif sur Nouvelles Architectures Parallèles" à Polytech'Paris-UPMC.

http://www-pequan.lip6.fr/~fortin/