Connaître votre marché est un élément fondamental de la planification, du marketing et de la distribution des produits. Il ne sert à rien de créer un produit sans marché ou de trouver que vous avez quelque chose d’étonnant mais de l’offrir au mauvais type de clients. Lorsque AMD a commencé à proposer des processeurs Threadripper à haut nombre de cœurs, le marché qui en a pris autant que possible était celui de la conception graphique – les sociétés d’effets visuels et celles axées sur le rendu ont adoré le nombre de cœurs, la prise en charge de la mémoire, toutes les voies PCIe, et le prix. Mais s’il y a une chose que plus de performance apporte, c’est le désir d’encore plus de performances. Entrez Threadripper Pro.

les graphiques informatiques deviennent brrrrrrr

Il existe un certain nombre d’industries qui, en regardant de l’extérieur, un passionné pourrait supposer que l’utilisation d’un processeur est probablement démodée – la question est posée de savoir pourquoi cette industrie n’a-t-elle pas totalement opté pour les accélérateurs GPU? L’un des plus grands est l’apprentissage automatique – malgré la poussée vers du matériel dédié au machine learning et de nombreuses grandes entreprises faisant du ML sur des GPU, la plupart des machines learning aujourd’hui se font encore sur des processeurs. Il en va de même avec les graphiques et les effets visuels.

La raison derrière cela se résume généralement aux progiciels utilisés et aux programmeurs en charge.

Le développement de logiciels pour les processeurs est facile, car c’est ce sur quoi la plupart des gens sont formés. Les packages d’optimisation pour les processeurs sont bien établis, et même pour les instructions spécialisées à venir, ils peuvent être développés dans des environnements simulés. Un processeur est conçu pour gérer presque tout ce qui lui est lancé, même du code très mauvais.

En revanche, le calcul GPU est plus difficile. Ce n’est pas aussi difficile qu’avant, car il existe de larges tableaux de bibliothèques qui permettent la compilation GPU sans avoir à en savoir trop sur la programmation d’un GPU, mais la difficulté réside dans l’architecture de la charge de travail pour tirer parti de ce que un GPU a à offrir. Un GPU est un moteur massif qui effectue la même opération sur des centaines de threads parallèles en même temps – il a également un très petit cache et les accès à la mémoire du GPU sont longs, de sorte que la latence est masquée en ayant encore plus de threads en vol à la fois . Si la partie calcul du logiciel ne se prête pas à ce type de charge de travail, comme être structurellement plus linéaire, passer 6 mois à redévelopper un GPU est un effort inutile. Ou même si les calculs fonctionnent mieux sur le GPU, essayer de reconstruire une base de code vieille de 20 ans (ou plus) pour les GPU nécessite toujours un engagement substantiel de la part d’un groupe d’experts.

Le calcul GPU arrive à pas de géant depuis que je l’ai fait à la fin des années 2000. Mais le fait demeure, c’est qu’il existe encore un certain nombre d’industries qui sont un mélange de débit CPU / GPU. Celles-ci incluent l’apprentissage automatique, le pétrole et le gaz, les finances, la médecine, et nous nous concentrons aujourd’hui sur les effets visuels.

Une charge de travail de conception et de rendu d’effets visuels est un mélange complexe de plates-formes logicielles et de plugins dédiés. Des logiciels comme Cinema4D, Blender, Maya, Autodesk et d’autres s’appuient sur le GPU pour présenter une scène partiellement rendue sur laquelle ces artistes peuvent travailler en temps réel, en s’appuyant également sur de solides performances monocœur, mais l’essentiel du calcul pour le rendu final dépendra sur quels plugins sont utilisés pour ce produit particulier. Certains plugins sont accélérés par GPU, tels que Blender Cycles, et le passage à des charges de travail plus accélérées par GPU prend son temps – la conception accélérée du traçage de rayons est un domaine qui retient beaucoup l’attention du GPU, par exemple.

Il y a toujours des questions quant à la méthode qui produit la meilleure image – il est inutile d’utiliser un GPU pour accélérer le temps de rendu s’il ajoute du bruit supplémentaire ou réduit la qualité. Un studio de cinéma est plus que susceptible de donner la priorité à un rendu lent de qualité supérieure sur les processeurs plutôt qu’à un rendu rapide et bruyant sur les GPU. Un certain nombre de studios diront carrément que la qualité du rendu sur un processeur est meilleure, et certains attribueront cela au fait qu’il est très facile de travailler sur des nombres 64 bits de haute précision sur un processeur, alors qu’un GPU 32 bits peut retomber en qualité sur les 36 bits nécessaires pour une véritable image HDR 12 bits (c’est évidemment beaucoup plus complexe que cela – la plupart des GPU utilisent une forme de 64 bits, mais les meilleurs sont aussi les plus chers et les plus professionnels. HPC uniquement).

Le point que je veux dire ici est que les studios VFX préfèrent toujours le calcul CPU, et plus il y en a, mieux c’est. Lorsque AMD a lancé ses nouveaux processeurs basés sur Zen, en particulier les modèles à 32 et 64 cœurs, ceux-ci ont été immédiatement désignés comme des remplaçants potentiels pour les Xeons utilisés dans ces studios VFX. Les parties d’AMD ont donné la priorité au calcul FP, un élément clé de la conception VFX, et avoir le double de cœurs par socket était également un gagnant, combiné à la grande quantité de cache par cœur. Cette dernière partie signifiait que même si les premières parties à grand nombre de cœurs avaient une architecture de mémoire non uniforme, ce n’était pas autant de problème qu’avec certains autres processus de calcul.

À notre connaissance, un certain nombre de sociétés d’effets visuels se sont concentrées sur la plate-forme Threadripper d’AMD sur l’EPYC correspondant. Lorsque ces deux pièces sont arrivées sur le marché, il était très facile pour les studios VFX d’investir dans des postes de travail sous le bureau construits sur Threadripper, tandis qu’EPYC était plus destiné aux installations en rack de serveurs et pas tellement aux postes de travail. Passez à Threadripper 3000 et EPYC 7002, et il y a maintenant 64 cœurs, 64 voies PCIe 4.0 et beaucoup de choix. Les studios VFX ont toujours opté pour Threadripper, principalement en raison de l’offre d’une puissance supérieure de 280 W dans quelque chose qui pourrait facilement être fourni par des intégrateurs de systèmes comme Armari, spécialisés dans les systèmes sous-bureau à haut calcul. Ils ont également demandé à AMD plus.

AMD a maintenant déployé sa plate-forme Threadripper Pro, répondant à certaines de ces exigences. Alors que VFX est toujours axé sur le calcul de base, le TR Pro offre désormais le double des voies PCIe, le double de la bande passante de la mémoire, la prise en charge jusqu’à 2 To de mémoire et la prise en charge des administrateurs de niveau Pro. Ces voies PCIe pourraient être étendues au stockage local (toujours important dans VFX) ainsi qu’aux grands RAMDisks, et le support administratif via DASH permet de garder les systèmes de l’entreprise gérés ensemble de manière appropriée. Le Memory Guard d’AMD fait également partie de sa gamme de composants Pro, conçus pour permettre un chiffrement complet de la mémoire.

Au-delà de VFX, AMD a cité le calcul de leadership mondial avec TR Pro pour l’ingénierie de produit avec Creo, la visualisation 3D avec KeyShot, la conception de modèles en architecture avec Autodesk Revit et la science des données, telle que l’analyse des ensembles de données pétrolières et gazières, où les ensembles de données se développent dans le des centaines de Go et nécessitent un support informatique substantiel.

Threadripper Pro contre Workstation EPYC (WEPYC)

En regardant les avantages que ces nouveaux processeurs offrent, il est clair qu’il s’agit davantage de pièces EPYC de type Workstation que de Threadrippers «améliorés». Voici une ventilation:

Comparaison AMD Zen 2 haut de gamme
AnandTech Threadripper Threadripper
Pro
Entreprise
EPYC
Noyaux 32 à 64 12-64 8-64
Produit phare 1P TR 3990X TR Pro 3995WX EPYC 7702P
PDSF 3990 $ 5490 $ 4425 $
TDP 280 W 280 W 200 W
Fréq de base 2900 MHz 2700 MHz 2 000 MHz
Turbo Fréq 4300 MHz 4200 MHz 3350 MHz
Prise sTRX40 sTRX4: WRX80 SP3
Cache L3 256 Mo 256 Mo 256 Mo
DRACHME 4 x DDR4-3200 8 x DDR4-3200 8 x DDR4-3200
Capacité DRAM 256 Go 2 To, ECC 4 To, ECC
PCIe Jeu de puces 4.0 x56 + Jeu de puces 4.0 x120 + 4,0 x 128
Fonctionnalités Pro Non Oui Oui

Pour obtenir ces nouvelles pièces à partir d’EPYC, tout ce qu’AMD avait à faire était d’augmenter le TDP à 280 W et de couper le support DRAM. Si nous partons d’une base Threadripper, il y a 3-4 changements substantiels. Alors pourquoi est-ce que cela s’appelle Threadripper Pro et non Workstation EPYC?

Nous revenons aux studios VFX. Ayant déjà adhéré à la marque et à la façon de penser de Threadripper, conserver ces pièces car Threadripper aide à faciliter cette transition – cette verticale avait en quelque sorte déjà dit qu’elle préférait Threadripper à EPYC, d’après ce qu’on nous dit, et donc garder le nom cohérent signifie que il n’y a pas de véritable rééducation à faire.

L’autre élément est que la gamme de processeurs EPYC est quelque peu fracturée: il existe des versions standard, des modèles H hautes performances, des modèles F haute fréquence, puis une série de conceptions personnalisées sous B, V et d’autres pour des clients spécifiques. En conservant cette nouvelle ligne sous le nom de Threadripper Pro, tout est sous un même toit.

Offres Threadripper Pro: 12 cœurs à 64 cœurs

AMD a annoncé ces processeurs au milieu de l’année dernière, ainsi que le Lenovo Thinkstation P620 comme plate-forme de lancement. D’après mon expérience, la gamme Thinkstation est très bien conçue et nous testons aujourd’hui notre 3995WX dans un P620.

AMD Ryzen Threadripper Pro
AnandTech Noyaux Base
Fréq
Turbo
Fréq
Chiplets L3
Cache
TDP Prix
SEP
3995WX 64/128 2700 4200 8 + 1 256 Mo 280 W 5490 $
3975WX 32/64 3500 4200 4 + 1 128 Mo 280 W 2750 $
3955WX 16/32 3900 4300 2 + 1 64 Mo 280 W 1 150 $
3945WX 12/24 4000 4300 2 + 1 64 Mo 280 W *
* Je ne sais pas s’il s’agit d’un modèle OEM spécial

Lorsque TR Pro a été annoncé avec Lenovo, nous ne savions pas si un autre OEM aurait accès à Threadripper. Lorsque nous avons interrogé les OEM à ce sujet plus tôt cette année-là, avant même de savoir si TR Pro était une réalité, ils ont déclaré qu’AMD n’avait même pas marqué la plate-forme sur leur feuille de route, ce que nous avions signalé à l’époque. Depuis, nous avons appris que Lenovo avait l’exclusivité de 6 mois et que les informations n’étaient fournies à d’autres fournisseurs (ASUS, GIGABYTE, Supermicro) qu’après l’annonce.

À cette fin, AMD a depuis annoncé que Threadripper Pro allait être commercialisé, à la fois pour que d’autres OEM conçoivent des systèmes ou pour que les utilisateurs finaux construisent les leurs. Malgré l’utilisation du même socket LGA4094 que les autres processeurs Threadripper et EPYC, TR Pro sera verrouillé sur les cartes mères WRX80. Nous en connaissons actuellement trois, tels que les modèles Supermicro et GIGABYTE, et nous avons également eu le modèle Wi-Fi ASUS Pro WS WRX80E-SAGE SE en interne pour une courte période pratique, bien que nous n’ayons pas pu le tester.

Sur les quatre processeurs énumérés ci-dessus, les trois premiers sont en vente. Il convient de noter que seul le 64-core est livré avec 256 Mo de cache L3, tandis que le 32-core est livré avec 128 Mo de L3. AMD a gardé que ces conceptions de chipsets n’utilisent que le nombre de chipsets absolument nécessaire, gardant le cache L3 par cœur cohérent ainsi que les 8 cœurs par chipset (la gamme de produits EPYC varie un peu).

Le quatrième processeur, le 12 cœurs, semble être un processeur spécifique aux OEM uniquement pour les systèmes préconstruits.

Threadripper Pro contre le monde

Ces offres Threadripper Pro sont conçues pour rivaliser avec deux segments: le premier est AMD eux-mêmes, montrant à quiconque utilise un système professionnel haut de gamme construit sur du matériel Zen de première génération qu’il y a beaucoup de performances à avoir. Le second est contre les clients des stations de travail Intel, soit en utilisant un seul socket Xeon W (qui dépasse à 28 cœurs), soit un système Xeon à double socket qui coûte plus cher ou utilise beaucoup plus d’énergie, simplement parce qu’il est à double socket, mais a également un architecture mémoire non uniforme.

Nous avons presque tous ceux-ci dans ce test (nous n’avons pas le 7702P, mais nous avons le 7742), et de manière réaliste, ce sont les seuls processeurs à prendre en compte si le 3995WX est une option pour vous:

Offres de comparaison 3995WX
AnandTech Coeur SEP 1P
2P
TDP Base
Fréq
De pointe
Fréq
DDR PCIe DDR
Casquette
TR Pro 3995WX 64C 5490 $ 1P 280 W 2700 4200 8 x 3200 128 x 4,0 2 To
TR 3990X 64C 3990 $ 1P 280 W 2900 4300 4×3200 64 x 4,0 ¼ To
EPYC 7702P 64C 4425 $ 1P 200 W 2000 3350 8 x 3200 128 x 4,0 4 To
EPYC 7742 64C 6950 $ 2P 225 W 2250 3400 8 x 3200 128 x 4,0 4 To
Xeon 6258R 28C 3950 $ 2P 205 W 2700 4000 6×2933 48 x 3,0 1 To
Xeon W-3175X 28C 2999 $ 1P 255 W 3100 4300 6×2933 48 x 3,0 ½ To

Intel dépasse à 28 cœurs, et il n’y a pas moyen de contourner cela. Techniquement, Intel a la gamme de processeurs AP qui va jusqu’à 56 cœurs, mais ceux-ci sont destinés aux systèmes spécialisés et nous n’en avons pas eu un physiquement envoyé pour test. Celles-ci coûtent également plus de 20 000 $ par processeur et sont deux processeurs dans le même système boulonnés sous un seul package.

Les points de comparaison AMD sont la meilleure option Threadripper et le meilleur processeur EPYC disponible, bien que la version 2P. La meilleure comparaison ici serait le 7702P, la variante à un seul socket et beaucoup plus compétitif en termes de prix, mais nous ne l’avons pas testé, à la place, nous avons l’EPYC 7742 d’AMD, qui est la version à double socket mais aux performances légèrement supérieures.

Configuration du test
AMD TR Pro TR Pro
3995WX
Lenovo
Thinkstation
P620
BIOS
S07K
T0EA
Lenovo Custom Kingston
8 x 16 Go
DDR4-3200 ECC
AMD TR TR 3990X MSI
Créateur
TRX40
BIOS
1,50
Thermaltake
280 mm AIO
Corsaire
4×8 Go
DDR4-3200
AMD
EPYC
EPYC 7742 Supermicro H11DSI BIOS
2,1
Noctua
NH-U14S
TR4-SP3
SK Hynix
16 x 32 Go
DDR4-3200
ECC
Intel
Xeon
Xeon Gold 6258R ASUS ROG
Dominus
Extrême
BIOS 0601 Asetek
690LX-PN
SK Hynix
6 x 32 Go
DDR4-2933
ECC
Xeon W-3175X DDR4-2666
ECC
GPU Sapphire RX 460 2 Go (tests du processeur)
PSU Divers (inc. Corsair AX860i)
SSD Crucial MX500 2TB
Ventilateurs Silverstone SST-FHP141-VF 173 CFM également utilisés. Sympa et bruyant.

Nous devons remercier les entreprises suivantes d’avoir aimablement fourni du matériel pour nos multiples bancs d’essai. Une partie de ce matériel n’est pas spécifiquement dans ce banc de test, mais est utilisée dans d’autres tests.

Les utilisateurs intéressés par les détails de notre suite de benchmark CPU actuelle peuvent se référer à notre article #CPUOverload qui couvre les sujets de l’automatisation de référence ainsi que ce que notre suite fonctionne et pourquoi. Nous comparons également beaucoup plus de données que ce qui est montré dans un examen typique, que vous pouvez toutes voir dans notre base de données de référence. Nous l’appelons ‘Banc», Et il y a aussi un lien en haut du site Web au cas où vous en auriez besoin pour comparer les processeurs à l’avenir.