L’un des points forts de Hot Chips 2019 a été la présentation du Cerebras Wafer Scale Engine – une puce de processeur AI aussi grosse qu’une plaquette, contenant 1,2 billion de transistors et fixée à plus de 46225 millimètres carrés de silicium. Cela a été rendu possible grâce à des techniques révolutionnaires dans la structuration réticulaire, mais avec le niveau de redondance intégré dans la conception, a garanti un rendement de 100% à chaque fois. Le premier système WSE, le CS-1, a été présenté au Supercomputing 2019, où nous avons eu la chance de mordre dans la conception avec Andrew Feldman, fondateur et PDG de Cerebras.

Malheureusement, je n’ai jamais réussi à rédiger mes discussions avec Andrew, mais ce que nous avons appris à l’époque, c’est que le CS1 est un châssis 15U entièrement intégré qui nécessite 20 kW d’énergie pour passer à la puce via 12 alimentations de 4 kW (certains redondance intégrée). La puce est montée verticalement pour des raisons de facilité d’accès, ce qui est assez bizarre dans le monde moderne de l’informatique. La plupart du châssis a été construit sur mesure pour le CS-1, y compris l’outillage et une bonne quantité d’impression 3D commerciale. Andrew a également déclaré à l’époque que bien qu’il n’y ait pas de quantité minimale de commande pour le CS-1, cependant, chacun coûterait «quelques millions».

L’annonce d’aujourd’hui du Pittsburgh Supercomputing Center (PSC) permet d’arrondir ce chiffre à environ 2 millions de dollars. Grâce à une subvention de 5 millions de dollars de la National Science Foundation (NSF) à la CFP, un nouveau supercalculateur IA sera construit, appelé Néocortex. Au cœur de Neocortex, le matériel sera construit en partenariat avec Cerebras et Hewlett Packard Enterprise.

Plus précisément, il y aura deux machines CS-1 au cœur de Néocortex. Le CS-1 prend en charge les modèles asynchrones via TensorFlow et pyTorch, avec la plate-forme logicielle capable d’optimiser la taille des charges de travail pour la zone disponible sur le CS-1 Wafer Scale Engine.


Chaque moitié de panneau avant est usinée à partir d’une seule pièce d’aluminium

La paire de machines CS-1 sera couplée à un serveur HPE Superdome Flex à mémoire partagée «extrême», qui contient 32 CPU Xeon, 24 To de DDR4, 205 To de stockage et 1,2 Tbps d’interface réseau. Neocortex devrait être utilisé pour permettre aux chercheurs en IA de former leurs modèles, couvrant des domaines tels que les soins de santé, les maladies, la production d’électricité, le transport, ainsi que les problèmes urgents de la journée.

La machine sera installée fin 2020. La CFP a déclaré que l’accès aux Néocortex sera disponible gratuitement aux chercheurs américains.

Lorsque nous avons parlé à Cerebras l’année dernière, la société a déclaré qu’elle avait déjà des commandes à «deux chiffres forts». Une fois pressé, j’ai réussi à faire passer ce chiffre de «12 à plusieurs dizaines». Un certain nombre de machines ont été commandées pour les Laboratoires nationaux d’Argonne à l’époque, et je soupçonne que d’autres investissent maintenant.

Chose intéressante, lors du salon Hot Chips 2020 de cette année, la société devrait dévoiler son moteur Wafer Scale Engine de deuxième génération. À mon avis, je dirais que cela est légèrement plus éloigné de la commercialisation que WSE1 lors de son annonce, mais la société semble avoir manifesté un intérêt considérable pour leur technologie.

Lecture connexe