Alors que les efforts habituels de présentation de NVIDIA pour l’année ont été anéantis par l’épidémie actuelle de coronavirus, la marche de l’entreprise vers le développement et la commercialisation de nouveaux produits s’est poursuivie sans relâche. À cette fin, lors de la conférence numérique sur la technologie GPU 2020 d’aujourd’hui, la société et son PDG Jensen Huang sont montés sur la scène virtuelle pour annoncer l’architecture GPU de prochaine génération de NVIDIA, Ampere, et les premiers produits qui l’utiliseront.

Comme le révèle la Volta il y a 3 ans – et est désormais traditionnel pour NVIDIA GTC – la priorité est aujourd’hui accordée au très haut de gamme du marché. En 2017, NVIDIA a lancé le GPU GV100 basé sur Volta, et avec lui l’accélérateur V100. Le V100 a été un énorme succès pour la société, développant considérablement son activité de centre de données sur le dos des nouveaux cœurs de tenseurs de l’architecture Volta et de la force brute pure qui ne peut être fournie que par un 800 mm2+ GPU. Maintenant en 2020, la société cherche à poursuivre cette croissance avec le successeur de Volta, l’architecture Ampere.

Maintenant, une entreprise beaucoup plus secrète qu’autrefois, NVIDIA a tenu sa future feuille de route GPU près de sa poitrine. Alors que le nom de code Ampere (entre autres) flotte depuis un certain temps maintenant, ce n’est que ce matin que nous obtenons enfin la confirmation de la présence d’Ampere, ainsi que nos premiers détails sur l’architecture. En raison de la nature de la présentation numérique de NVIDIA – ainsi que des informations limitées fournies dans les pré-briefings de presse de NVIDIA – nous n’avons pas encore tous les détails sur Ampere. Cependant, pour ce matin au moins, NVIDIA aborde les points forts de l’architecture pour ses clients de calcul de centre de données et d’intelligence artificielle, et quelles innovations majeures Ampere apporte pour les aider avec leurs charges de travail.

Le coup d’envoi pour la famille Ampere est l’A100. Officiellement, c’est le nom du GPU et de l’accélérateur qui l’intègre; et au moins pour le moment, ils sont tous les deux identiques, car il n’y a qu’un seul accélérateur utilisant le GPU.

Comparaison des spécifications de l’accélérateur NVIDIA
A100 V100 P100
FP32 CUDA Cores 6912 5120 3584
Boost Clock ~ 1,41 GHz 1530 MHz 1480 MHz
Horloge mémoire 3,2 Gbit / s HBM2 1,75 Gbit / s HBM2 1,4 Gbit / s HBM2
Largeur du bus mémoire 5120 bits 4096 bits 4096 bits
Bande passante mémoire 1,6 To / sec 900 Go / sec 720 Go / sec
VRAM 40 Go 16 Go / 32 Go 16 GB
Précision unique 19.5 TFLOP 15.7 TFLOP 10.6 TFLOP
Double precision 9.7 TFLOP
(1/2 tarif)
7.8 TFLOP
(1/2 tarif)
5.3 TFLOP
(1/2 tarif)
INT8 Tenseur 624 TOP N / A N / A
FP16 Tensor 312 TFLOP 125 TFLOP N / A
TF32 Tensor 156 TFLOP N / A N / A
Interconnecter NVLink 3
12 liens (600 Go / sec)
NVLink 2
6 liens (300 Go / sec)
NVLink 1
4 liens (160 Go / sec)
GPU A100
(826 mm2)
GV100
(815 mm2)
GP100
(610 mm2)
Nombre de transistors 54.2B 21.1B 15,3B
TDP 400W 300W / 350W 300W
Processus de fabrication TSMC 7N TSMC 12nm FFN TSMC 16nm FinFET
Interface SXM4 SXM2 / SXM3 SXM
Architecture Ampère Volta Pascal

Conçu pour être le successeur de l’accélérateur V100, l’A100 vise tout aussi haut, tout comme nous l’attendions du nouvel accélérateur phare de NVIDIA pour le calcul. La partie Ampère leader est construite sur le processus 7 nm de TSMC et intègre 54 milliards de transistors, 2,5 fois plus que le V100 avant. NVIDIA a mis en œuvre les améliorations de densité complète offertes par le processus 7 nm, puis certaines, car la matrice GPU résultante mesure 826 mm2 de taille, encore plus grand que le GV100. NVIDIA est allé grand sur la dernière génération, et pour se surpasser, ils sont devenus encore plus gros cette génération.

Nous aborderons plus en détail les spécifications individuelles un peu plus tard, mais à un niveau élevé, il est clair que NVIDIA a investi plus dans certains domaines que dans d’autres. Les performances du FP32 ne sont, sur le papier, que légèrement améliorées par rapport au V100. Pendant ce temps, les performances du tenseur sont considérablement améliorées – près de 2,5 fois pour les tenseurs FP16 – et NVIDIA a considérablement étendu les formats pouvant être utilisés avec le support INT8 / 4, ainsi qu’un nouveau format FP32 appelé TF32. La bande passante mémoire est également attendue de manière significative, avec plusieurs piles de mémoire HBM2 fournissant un total de 1,6 To / seconde de bande passante pour nourrir la bête qui est Ampère.

NVIDIA fournira la version initiale de cet accélérateur dans leur format SXM désormais commun, qui est une carte de type mezzanine bien adaptée à une installation dans des serveurs. De génération en génération, la consommation d’énergie a de nouveau augmenté, ce qui convient probablement à une génération appelée Ampère. Au total, l’A100 est évalué à 400 W, contre 300 W et 350 W pour différentes versions du V100. Cela rend le facteur de forme SXM d’autant plus important pour les efforts de NVIDIA, car les cartes PCIe ne conviendraient pas à ce type de consommation électrique.

Quant à l’architecture Ampere elle-même, NVIDIA publie aujourd’hui des détails limités à ce sujet. Attendez-vous à en entendre davantage au cours des prochaines semaines, mais pour l’instant NVIDIA confirme qu’ils conservent leurs différentes gammes de produits compatibles sur le plan architectural, bien que dans des configurations potentiellement très différentes. Donc, bien que la société ne parle pas d’Ampere (ou de dérivés) pour les cartes vidéo aujourd’hui, ils indiquent clairement que ce sur quoi ils ont travaillé n’est pas une architecture de calcul pure, et que les technologies d’Ampere seront également présentes dans les parties graphiques. , probablement avec de nouvelles fonctionnalités pour eux aussi. En fin de compte, cela fait partie de la stratégie en cours de NVIDIA pour garantir qu’ils ont un écosystème unique, où, pour citer Jensen, «Chaque charge de travail unique s’exécute sur chaque GPU unique.»

C’est les dernières nouvelles