La deuxième GTC de NVIDIA de 2020 a lieu cette semaine, et comme cela est rapidement devenu une tradition, l’un des «chats de cuisine» du CO Jensen Huang lance l’événement. En tant que remplaçant de facto de GTC Europe, cette GTC virtuelle d’automne est un événement un peu moins important que l’édition de printemps, mais c’est toujours un événement qui voit du matériel NVIDIA introduit dans le monde.

Pour commencer, nous avons une paire de nouvelles cartes vidéo de NVIDIA – et un lancement qui semble indiquer que NVIDIA se prépare à refondre sa marque de visualisation professionnelle. La carte NVIDIA RTX A6000, la carte de visualisation professionnelle de nouvelle génération basée sur Ampère, sera annoncée aujourd’hui et devrait être livrée à la fin de l’année. Successeur du Quadro RTX 8000/6000 basé sur Turing, l’A6000 sera la carte graphique professionnelle phare de NVIDIA, offrant tout ce qui est sous le soleil en ce qui concerne les fonctionnalités graphiques de NVIDIA, et des performances exceptionnelles pour la sauvegarder. L’A6000 sera une carte Quadro dans tout sauf le nom; au sens propre.

Carte de visualisation professionnelle NVIDIA
Comparaison des spécifications
A6000 A40 RTX 8000 GV100
Cœurs CUDA 10752 10752 4608 5120
Cœurs de tenseurs 336 336 576 640
Boost Clock ? ? 1770 MHz ~ 1450 MHz
Horloge mémoire GDDR6 16 Gbit / s GDDR6 14,5 Gbit / s GDDR6 14 Gbit / s 1,7 Gbit / s HBM2
Largeur du bus mémoire 384 bits 384 bits 384 bits 4096 bits
VRAM 48 Go 48 Go 48 Go 32 Go
ECC Partiel
(DRACHME)
Partiel
(DRACHME)
Partiel
(DRACHME)
Plein
Demi précision ? ? 32,6 TFLOPS 29,6 TFLOPS
Précision unique ? ? 16.3 TFLOPS 14,8 TFLOPS
Performance du tenseur ? ? 130,5 TFLOPS 118,5 TFLOP
(FP16)
TDP 300 W 300 W 295 W 250 W
Refroidissement actif Passif actif actif
NVLink 1x NVLink3
112,5 Go / s
1x NVLink3
112,5 Go / s
1x NVLInk2
50 Go / s
2x NVLInk2
100 Go / s
GPU GA102 GA102 TU102 GV100
Architecture Ampère Ampère Turing Volta
Processus de fabrication Samsung 8nm Samsung 8nm TSMC 12 nm FFN TSMC 12 nm FFN
Prix ​​de lancement ? ? 10 000 $ 9 000 $
Date de lancement 12/2020 T1 2021 T4 2018 Mars 2018

Première carte de visualisation professionnelle à être lancée sur la base de la nouvelle architecture Ampere de NVIDIA, l’A6000 permettra à NVIDIA d’atteindre le marché de son mieux. La carte utilise un GPU GA102 entièrement activé – la même puce que celle utilisée dans les GeForce RTX 3080 et 3090 – et avec 48 Go de mémoire, elle contient autant de mémoire que NVIDIA peut mettre sur une seule carte GA102 aujourd’hui. Notamment, l’A6000 utilise ici GDDR6 et non le GDDR6X plus rapide utilisé dans les cartes GeForce, car les puces de RAM de densité 16 Go ne sont pas disponibles pour cette dernière mémoire pour le moment. En conséquence, bien qu’il soit basé sur le même GPU, il y aura des différences de performances intéressantes entre l’A6000 et ses frères GeForce, car il a échangé la bande passante mémoire contre la capacité de mémoire globale.

En termes de performances, NVIDIA promeut le A6000 comme offrant près de deux fois les performances (ou plus) du Quadro RTX 8000 dans certaines situations, en particulier les tâches profitant de l’augmentation significative des cœurs FP32 CUDA ou de l’augmentation similaire des performances du débit du cœur RT . Malheureusement, NVIDIA n’a pas encore verrouillé les spécifications de la carte ou choisit de ne pas les annoncer pour le moment, nous ne savons donc pas quelles seront les vitesses d’horloge et les performances résultantes dans FLOPS. Notamment, l’A6000 n’a qu’un TDP de 300W, 20W inférieur à la GeForce RTX 3090, donc je m’attendrais à ce que cette carte soit cadencée plus bas que la 3090.

Sinon, comme nous l’avons vu avec les cartes GeForce lancées le mois dernier, Ampère en lui-même n’est pas une refonte technologique majeure de l’architecture Turing précédente. Ainsi, bien que plus récent et nettement plus puissant, il n’y a pas beaucoup de nouvelles fonctionnalités de sélection sur la carte. Outre le nombre accru de types de données pris en charge dans les cœurs de tenseur (en particulier BFloat16), les autres changements les plus susceptibles d’être remarqués par les utilisateurs professionnels de la visualisation sont la prise en charge du décodage du nouveau codec AV1, ainsi que la prise en charge de PCI-Express 4.0, qui donner aux cartes deux fois la bande passante du bus lorsqu’elles sont utilisées avec les plates-formes récentes d’AMD.

Comme la Quadro de génération actuelle, la carte à venir bénéficie également du support ECC. NVIDIA n’a jamais répertorié GA102 comme offrant l’ECC sur ses voies internes – cela est traditionnellement limité à leurs grosses puces de classe centre de données – il s’agit donc presque certainement d’une prise en charge partielle via ECC «souple», qui offre une correction d’erreur contre les bus DRAM et DRAM par mettre de côté une certaine capacité et bande passante DRAM pour fonctionner comme ECC. Les cartes prennent également en charge un seul connecteur NVLink – maintenant jusqu’à NVLink 3 – permettant à une paire d’A6000 d’être pontés ensemble pour plus de performances et de partager leurs pools de mémoire pour les applications prises en charge. L’A6000 prend également en charge le verrouillage de cadre standard de NVIDIA et les fonctionnalités 3D Vision Pro avec leurs connecteurs respectifs.

Pour les sorties d’affichage, l’A6000 est livré avec une configuration quad-DisplayPort, ce qui est typique des cartes de visualisation professionnelles haut de gamme de NVIDIA. Notamment cette génération, cependant, cela signifie que le A6000 est dans un endroit un peu étrange car DisplayPort 1.4 est plus lent que la norme HDMI 2.1 également prise en charge par le GPU GA102. Je m’attendrais à ce qu’il soit possible pour la carte de piloter un écran HDMI 2.1 avec un adaptateur passif, mais cela dépendra de la façon dont NVIDIA a configuré la carte et si la signalisation HDMI 2.1 tolère un tel adaptateur.

Enfin, l’A6000 sera la première des cartes vidéo d’aujourd’hui à être expédiée. Selon NVIDIA, la carte sera disponible dans la chaîne en tant que carte d’extension à partir de la mi-décembre – juste à temps pour un lancement en 2020. La carte commencera ensuite à apparaître dans les systèmes OEM au début de 2021.

NVIDIA A40 – ProViz passif

Rejoindre le nouveau A6000 est une carte très similaire conçue pour le refroidissement passif, la NVIDIA A40. Basé sur le même GPU GA102 que l’A6000, l’A40 offre pratiquement toutes les mêmes fonctionnalités que l’A6000 à refroidissement actif, dans un format purement passif adapté à une utilisation dans des serveurs haute densité.

En chiffres, l’A40 est une carte graphique de niveau phare similaire, utilisant un GPU GA102 entièrement activé. Ce n’est pas tout à fait un jumeau du A6000, mais à part la différence de refroidissement, le seul autre changement sous le capot est la configuration de la mémoire. Alors que l’A6000 utilise 16 Gbps GDDR6, A40 l’horloge à 14,5 Gbps. Sinon, NVIDIA n’a pas révélé les vitesses d’horloge du GPU attendues, mais avec un TDP de 300 W, nous nous attendons à ce qu’elles soient similaires à l’A6000.

Dans l’ensemble, NVIDIA n’est pas étranger à l’offre de cartes refroidies passivement; Cependant, cela fait longtemps que nous n’avons pas vu pour la dernière fois une carte Quadro haut de gamme à refroidissement passif. Plus récemment, les cartes passives de NVIDIA ont été destinées au marché du calcul, avec des composants tels que le Tesla T4 et le P40. L’A40, en revanche, est un peu différent et un peu plus ambitieux, et reflète les frontières floues entre le calcul et les graphiques dans au moins certains des marchés de NVIDIA.

L’impact le plus notable ici est l’inclusion des sorties d’affichage, ce qui n’a jamais été sur les cartes de calcul de NVIDIA pour des raisons évidentes. L’A40 comprend trois sorties DisplayPort (une de moins que l’A6000), ce qui permet à la carte centrée sur le serveur de piloter directement un écran. En expliquant l’inclusion des E / S d’affichage dans une partie serveur, NVIDIA a déclaré avoir reçu des demandes d’utilisateurs du secteur des médias et de la diffusion, qui utilisaient des serveurs dans des endroits tels que des camions vidéo, mais qui avaient encore besoin de sorties d’affichage.

En fin de compte, cela sert en quelque sorte de différenciateur de fonctionnalités supplémentaires entre l’A40 et la carte de calcul PCIe officielle de NVIDIA, la PCIe A100. Comme l’A100 ne dispose d’aucune fonctionnalité d’affichage vidéo (le processeur A100 sous-jacent a été conçu pour des tâches de calcul pures), l’A40 est le contrepoint de ce produit, offrant quelque chose avec un support de sortie vidéo très explicite à la fois à l’intérieur et à l’extérieur de la carte. Et bien qu’il ne soit pas spécifiquement destiné au marché du calcul de périphérie, où le T4 règne toujours en maître, ne vous y trompez pas: l’A40 est toujours capable d’être utilisé comme une carte de calcul. Bien que dépourvu de certaines des fonctionnalités spécialisées d’A100 telles que le GPU multi-instance (MIG), l’A40 est entièrement capable d’être provisionné en tant que carte de calcul, y compris la prise en charge du profil vGPU Virtual Compute Server. La carte est donc une alternative potentielle à l’A100, du moins là où le débit FP32 peut être préoccupant.

Enfin, à l’instar de l’A6000, l’A40 sortira prochainement dans les rues. Conçu pour être principalement vendu via des OEM, NVIDIA s’attend à ce qu’il commence à apparaître sur les serveurs au début de 2021.

Quadro pas plus?

Pour les observateurs de longue date, le développement le plus intéressant du lancement d’aujourd’hui est peut-être ce qui n’est pas présent: la marque Quadro de NVIDIA. Bien qu’il soit destiné à leur marché traditionnel de la visualisation professionnelle, l’A6000 n’est pas considéré comme une carte Quadro, un changement qui a été apporté presque à la dernière minute.

Peut-être à cause de ce changement de dernière minute, NVIDIA n’a publié aucune explication officielle de sa décision. À première vue, c’est certainement étrange, car la marque Quadro est l’une des marques les plus anciennes de NVIDIA, juste derrière GeForce elle-même. NVIDIA contrôle toujours la part du lion du marché de la visualisation professionnelle, donc à première vue, il semble y avoir peu de raisons pour NVIDIA de secouer un marché très stable.

Cela dit, il y a quelques facteurs en jeu qui peuvent motiver la décision de NVIDIA. D’abord et avant tout, l’entreprise a déjà retiré l’une de ses autres marques de produits ces dernières années: Tesla. Auparavant utilisé pour les accélérateurs de calcul de NVIDIA, Tesla a été retiré et n’a jamais été remplacé, nous laissant avec les NVIDIA T4 et A100. Bien sûr, Tesla est un cas particulier, car le nom est de plus en plus devenu synonyme de constructeur de voitures électriques, même s’il a été sélectionné dans les deux cas comme référence au célèbre scientifique. Quadro, en comparaison, a un chevauchement relativement faible (mais non nul) avec d’autres entités commerciales.

Mais peut-être plus significatif que cela est l’état général des activités professionnelles de NVIDIA. Pierre angulaire importante des produits graphiques de NVIDIA, la visualisation professionnelle est un marché assez stable – c’est-à-dire qu’il ne s’agit pas d’un marché en croissance majeure comme l’ont été les jeux et les datacenters. En conséquence, la visualisation professionnelle est lentement absorbée par les parties de calcul de NVIDIA, en particulier dans l’espace serveur où de nombreux produits peuvent être provisionnés pour des besoins de calcul ou de graphiques. Dans tous ces cas, Quadro et l’ancienne gamme Tesla de NVIDIA en sont venues à représenter les offres «premium» de NVIDIA: des pièces qui donnent accès à la suite complète des fonctionnalités matérielles et logicielles de NVIDIA, contrairement aux produits GeForce grand public qui ont certaines fonctionnalités haut de gamme retenues. .

Il se peut donc très bien que NVIDIA ne perçoive pas trop longtemps le besoin d’une marque Quadro spécifique, car le marché de Quadro (visualisation professionnelle) et de Tesla (informatique) ne font qu’un. Bien que les deux diffèrent dans leurs besoins spécifiques, ils utilisent toujours le même matériel NVIDIA et paient souvent les mêmes prix NVIDIA élevés.

En tout cas, il sera intéressant de voir où NVIDIA va à partir d’ici. Même avec le chevauchement des audiences, la segmentation de la marque a parfois ses avantages. Et avec NVIDIA produisant désormais des GPU dépourvus de capacités d’affichage critiques (GA100), il semble que le fait de préciser quel matériel peut (et ne peut pas) être utilisé pour les graphiques restera important à l’avenir.