L’une des mesures clés que nous attendions depuis le lancement de l’architecture Zen d’AMD a été le moment où il réintégrerait la liste des 10 meilleurs superordinateurs. Le meilleur système AMD précédent, basé sur les processeurs Opteron, était Titan, qui occupait la première place en 2012, mais a lentement quitté le top 10 en juin 2019. Aujourd’hui, en juin 2020, AMD remporte une grande victoire pour sa microarchitecture Zen 2 en vous rendant au # 7. Mais il y a une torsion dans ce conte.

Mesurer le succès par la liste TOP500 n’est pas tant pour marquer des revenus, mais pour marquer du prestige. Sur la base de données se trouvent des systèmes qui ont été construits il y a plus de dix ans, donc une chance de mettre quelque chose dans la liste sur le dernier et le meilleur à une fraction de la taille et de la puissance finit par être une grande opportunité promotionnelle pour l’entreprise dont le matériel est impliqué ( ainsi que l’endroit où il finit par être basé). Évidemment, depuis que AMD a commencé à introduire ses nouveaux processeurs basés sur Zen, pour revenir au haut de gamme après plusieurs années, nous nous demandons combien de temps cela prendrait pour un déploiement AMD à grande échelle.

AMD a connu le succès HPC dans le passé, notamment avec le supercalculateur Titan, construit sur un mélange de processeurs Opteron 6274 couplés à des cartes accélératrices NVIDIA K20x. La machine a atteint le n ° 1 en 2012 et se situe toujours au n ° 12 aujourd’hui. Il s’agissait d’un déploiement important, à 17,6 PetaFLOP pour 8,2 mégawatts.

De retour dans la journée, l’événement est allé voir:

À l’intérieur du supercalculateur Titan: 299 000 cœurs AMD x86 et 18,6 000 GPU NVIDIA


Retour en 2012

En ce qui concerne les designs Zen d’AMD, les deux principaux processeurs que nous devons rechercher sont Naples (1st Gen EPYC) et Rome (2Dakota du Nord Gén EPYC). Ce dernier a fait l’objet de beaucoup d’attention pour avoir jusqu’à 64 cœurs hautes performances ainsi que beaucoup de bande passante mémoire et des tas de connectivité pour le stockage et les cartes d’extension.

Cependant, le premier système Zen sur le top 500 n’était techniquement ni l’un ni l’autre.

La joint-venture Hygon a en fait fourni le premier supercalculateur basé sur Zen à rejoindre la liste en novembre 2018 au n ° 38. Il s’agissait d’un système construit chez Sugon, la société qui distribue les systèmes Hygon, pour présenter le matériel. Il a utilisé 5120 des processeurs Hygon 32 core. Nous avons examiné et approfondi le matériel Hygon. La joint-venture Hygon s’est dissoute depuis, mais le supercalculateur sur lequel elle est basée fonctionne toujours au 58e rang.

Ce n’est que fin 2019 que des systèmes basés sur AMD EPYC apparaissent. Dans la liste de novembre, nous avons vu deux systèmes AMD Naples et deux systèmes AMD Rome pousser le total d’AMD à six (5 basés sur EPYC, un sur des Opterons plus anciens). Pour l’annonce de juin 2020 cette semaine, sept autres systèmes AMD Rome sont dans la liste, faisant de Rome le 10e famille de processeurs la plus populaire pour les superordinateurs. Mais c’est Selene au 7e rang qui fait la une des journaux.

Selene est le nom du nouveau supercalculateur assis au # 7. Pour les processeurs hôtes, il utilise les pièces AMD Rome 7742, qui sont les pièces commerciales les plus performantes disponibles qui ne sont pas destinées aux marchés spécialisés – techniquement un prix catalogue de 6950 $ chacune. Ce qui rend Selene un peu étrange pour une victoire AMD, c’est qu’il fait partie d’un supercalculateur construit avec des accélérateurs NVIDIA A100. Et il est également conçu pour NVIDIA à utiliser chez NVIDIA.

Lorsque NVIDIA a annoncé sa nouvelle carte accélératrice A100 Ampère pour le calcul, elle a également annoncé le concept d’un «SuperPod» DGX A100, connectant 140 nœuds DGX A100 et 1120 GPU A100 pour fournir jusqu’à 700 PetaOP de performances basées sur l’IA. Il s’avère que ce concept de SuperPOD arrive également juste à frapper # 7 dans la liste des superordinateurs TOP500, qui utilise des FLOP LINPACK FP64 plus traditionnels, tout de suite. Chacun des nœuds DGX A100 contient deux processeurs AMD EPYC et huit accélérateurs A100.

Selene obtient une performance de 27,6 PetaFLOPs de débit FP64, pour 1,3 mégawatts de puissance. Comparé au précédent supercalculateur Titan, qui avait des accélérateurs Opterons et K20x, c’est 57% de performances en plus pour seulement 16% de la puissance, ce qui le rend presque 10 fois plus efficace. Selene utilise le Mellanox HDR Infiniband de NVIDIA pour la connectivité et dispose de 560 To de mémoire installés.

Au lancement, NVIDIA a déclaré qu’un nœud DGX A100 coûterait 199 000 $. Cela rend le déploiement matériel pour Selene (commutateurs moins, coût d’installation, câblage) quelque part autour de 28 millions de dollars. Il convient de noter qu’il s’agit techniquement de seulement 280 processeurs EPYC associés à 1120 GPU A100, combinés ensemble pour 277760 «cœurs». Il semble étrange de suggérer que «c’est tout ce qu’il faut» pour atteindre le 7e rang.

Les victoires pour AMD sur Zen sont maintenant (avec Rmax):

  • #7, Selene, un système EPYC 7742 + A100 pour NVIDIA (27,6 PF)
  • # 30, Belenos, un système EPYC 7742 pour Meteo France (7.7 PF)
  • # 34, Joliot-Curie Rome, un système EPYC 7H12 pour le CEA en France (7.0 PF)
  • # 48, Mahti, un système EPYC 7H12 pour CSC en Finlande (5.4 PF)
  • # 56, Betzy, un système EPYC 7742 pour Sigam2 AS en Norvège (4.44 PF)
  • # 58, PreE, un système Hygon C86 pour Sugon, Chine (4,32 PF)
  • # 124, Homme libre, un système EPYC 7542 pour ERDC DSRC (2.5 PF)
  • # 172, Betty, un système EPYC 7542 pour le US Army Research Laboratory (2.1 PF)
  • # 268, Cara, un système EPYC 7601 pour le centre aérospatial allemand (1,75 PF)
  • # 292, un système EPYC 7501 + Vega 20 pour Pukou Advanced Computing Center, Chine (1,66 PF)
  • # 483, spartiate, un système EPYC 7H12 pour Atos, France (1,26 PF)

Tous sont nouveaux au cours de la dernière année, à l’exception de # 58, le système Hygon.

Les deux principaux supercalculateurs à venir pour AMD font tous deux partie du projet américain Exascale.

Frontier devrait avoir 1,5 ExaFLOP d’EPYC et Radeon Instinct dans une conception de 30 mégawatts à Oak Ridge, construit par Cray (HPE), pour 2021.

El Capitan est réglé sur 2.0 ExaFLOP d’EPYC et Radeon Instinct dans une conception de 30 mégawatts au Lawrence Livermore National Laboratory, construit par Cray (HPE), pour le début de 2023.

L’autre projet américain Exascale aux États-Unis est Aurora, avec 1,0 Exaflops de Xeon et Xe, pour les Argonne National Laboratories, prévu pour fin 2021.

Supercalculateurs Exascale du Département américain de l’énergie
El Capitan Frontière Aurore
Architecture CPU AMD EPYC « Gênes »
(Zen 4)
AMD EPYC
(Future Zen)
Intel Xeon évolutif
Architecture GPU Instinct de Radeon Instinct de Radeon Intel Xe
Performance (RPEAK) 2.0 EFLOPS 1.5 EFLOPS 1 EFLOPS
Consommation d’énergie <40MW ~ 30MW N / A
Noeuds N / A 100 armoires N / A
Laboratoire Lawrence Livermore Oak Ridge Argonne
Vendeur Cray Cray Intel
An 2023 2021 2021

AMD est toujours déterminé à atteindre son objectif de 10% de parts de marché pour EPYC d’ici le milieu de l’année. Étant donné que le milieu se situe généralement quelque part au T2 / T3 et que nous sommes prêts à entrer au T3, nous devrions bientôt en savoir plus sur cet objectif et sur la manière dont COVID-19 a peut-être ajusté ces attentes.

Lecture connexe