L’une des histoires qui bouillonnent dans le fond de l’industrie est l’objectif «25×20» auto-imposé par AMD. En commençant par les performances en 2014, AMD s’est engagé envers lui-même, ses clients et les investisseurs à réaliser une amélioration globale de 25% de son «efficacité de performance» d’ici 2020, qui est fonction des performances brutes et de la consommation d’énergie. À l’époque, AMD définissait son produit mobile Kaveri comme la base du défi – certes une barre très basse – mais chaque année, AMD nous a mis à jour sur ses progrès. Cette année étant 2020, la question qui se pose à moi depuis le lancement du Zen2 pour mobile était de savoir si AMD avait atteint son objectif, et si oui, de combien? La réponse est oui, et par beaucoup.

Dans cet article, nous récapitulerons le projet 25×20, comment les mesures sont calculées et ce que cela signifie pour AMD à long terme.

Renoir 2020: nouveau silicium, objectif atteint

L’annonce faite aujourd’hui par AMD confirme que la société a atteint son objectif de 25 fois l’efficacité des performances d’ici la fin de 2020, à partir de la base de référence Kaveri. Voici le graphique important:

Comme nous pouvons le voir en utilisant cette métrique, il y a eu de gros sauts de Kaveri à Carrizo, de Bristol Ridge à Raven Ridge, puis une série de stagnation sur Zen / Zen +, avant finalement une bosse vers Renoir. Cela donne trois sauts distincts:

  • Kaveri à Carrizo était 3,5x,
  • Bristol à Raven était 2,2x,
  • puis Picasso à Renoir était de 2,92x

La valeur de base de l’objectif d’AMD réside dans ses processeurs mobiles Kaveri, qui, selon les normes actuelles, fixent une barre très basse. Au fur et à mesure que AMD a déménagé à Carrizo, il a mis en œuvre de nouvelles fonctionnalités de surveillance de l’alimentation sur puce qui ont permis au système d’offrir une meilleure distribution de l’énergie et de se rapprocher de la tension réelle nécessaire, sans gaspiller l’énergie. Après Carrizo est arrivé Bristol Ridge, toujours basé sur les cœurs plus anciens, mais utilisé un nouveau contrôleur DDR4 ainsi que des processeurs de puissance inférieure qui étaient mieux optimisés pour l’efficacité.

Un grand bond est venu avec Raven Ridge, avec AMD combinant ses nouveaux cœurs Zen x86 très efficaces et les graphiques intégrés Vega. Cela a annoncé une amélioration considérable des performances en raison du doublement des cœurs et de l’amélioration des graphismes, le tout dans une fenêtre de puissance similaire à celle de Bristol Ridge. Cela a stimulé l’importante mesure 25×20 et l’a maintenue bien au-dessus du gain «linéaire».

De 2017 à 2019, cela a finalement été une pause dans la stratégie d’AMD, notamment parce qu’il n’y a pas eu de changements de conception importants. Les versions de Raven Ridge 2017/2018 se résument à de légères différences de SKU utilisées pour la métrique, mais finalement au moment de mesurer les systèmes AMD était un peu hors cycle ici. Le passage de Raven Ridge à Picasso a été un changement de l’utilisation de GlobalFoundries 14nm à 12nm, ce qui offre un léger gain de puissance mais pas tellement sur les performances. Passer de 2017 à 2019 a tout de même généré un gain de 23,5% au sein de la même famille de produits, principalement en raison de mises à jour de fabrication mineures et de meilleurs algorithmes de binning ou d’alimentation. C’était à l’époque de Picasso lorsque les OEM ont commencé à prendre plus au sérieux la plate-forme d’ordinateurs portables AMD, en particulier en tant que leader de Renoir en 2020.

Le saut de Picasso à Renoir est bien documenté. Notre première utilisation des processeurs, examinée dans l’ASUS Zephyrus G14, nous a laissé la bouche ouverte, presque littéralement. Nous l’avons appelé un «Mobile Revival», présentant la transition d’AMD de Zen + à Zen2, de GF 12nm à TSMC 7nm, avec beaucoup de conception et d’optimisation solides du côté graphique. Les changements de la puce 2019 à 2020 incluent le doublement du nombre de cœurs, de quatre à huit, l’amélioration des performances d’horloge pour horloge de 15 à 20%, mais également l’amélioration des performances graphiques et des fréquences malgré le passage d’une conception en silicium qui avait 11 unités de calcul à 8. Cela correspond à un certain nombre de mises à jour de puissance, conformément aux spécifications AHCI, et comme nous en avons discuté avec Sam Naffziger, AMD Fellow, le soutien aux nouveaux états de faible puissance S0ix a énormément aidé. La réduction de la puissance de la matrice, ainsi que la bande passante mémoire supplémentaire, ont offert des gains importants.

Le saut de Picasso à Renoir est de 2,92x, amenant AMD à 31,77x au-dessus de la cible d’origine. Objectif atteint et bravo aux équipes d’AMD qui ont réussi cet objectif ambitieux.

Comment AMD a-t-il défini la façon dont l’objectif sera mesuré? C’est en petits caractères.

Calcul de X: obtenez-moi un facteur X

AMD appelle la valeur qu’il calcule comme X, définie comme le rapport entre une mesure de performance C et une mesure d’efficacité E. En 2017, il a donné des notes détaillées sur la façon dont il calcule ces valeurs:

  1. Efficacité globale des performances X est C divisé par E
  2. Performance C est un processeur pf moyen de 50:50 et des performances GPU par rapport à Kaveri
    – Performances CPU de Score Cinebench R15 nT

    – Performances GPU de Score 3DMark 11 P

  3. Utilisation d’énergie E est défini par la «  consommation d’énergie typique des ordinateurs portables  » selon les exigences du programme Energy Star, Rev 6.1 Oct-2014
  4. Kaveri est le référenceX = 1

La sauce secrète est basée sur la façon dont vous calculez C et E. L’équation du titre est comme indiqué ci-dessus:

La métrique de calcul C est relativement facile à comprendre. Ici, AMD prend la moyenne pondérée de 50 à 50 des performances CPU et GPU avec le Cinebench R15 multi-filet test et 3D Mark 11 P référence complète.

En utilisant Kaveri comme résultat de base de 1,0, Carrizo obtient 1,23, Bristol Ridge obtient 1,36 et Raven Ridge 2017 obtient 2,47, etc.

La métrique d’efficacité E est beaucoup plus compliqué. Il repose sur un modèle «d’utilisation typique de l’énergie» défini par le programme ETEC Energy Star qui ajoute des poids basés sur la puissance de veille, la puissance de ralenti et une certaine puissance de chargement. L’équation ressemble un peu à ceci:

Les options PT (x) sont la puissance consommée dans ces modes. La principale chose à faire apparaître à propos de cette métrique est qu’elle finit par être très dépendante de l’appareil ou de l’ordinateur portable dans lequel le processeur est utilisé. Si vous voulez le meilleur résultat, vous avez besoin d’un appareil qui a une faible puissance, de préférence une faible résolution mais affichage efficace, un petit SSD efficace, aussi peu de contrôleurs que possible et autant d’espace libre thermique que possible. Le meilleur environnement devient cet hybride étrange de composants haut de gamme mais de faibles spécifications.

Pour cette métrique, AMD utilise ses plateformes de référence internes, qui sont souvent basées sur l’un des premiers appareils à être lancés avec le nouveau produit. C’est là que nous pensons au départ que les améliorations d’AMD entrent en jeu – les premiers appareils en 2017 avec Raven Ridge étaient, non pas pour enrober le sucre, plutôt au milieu de la route. Comme indiqué par notre site Web sœur Laptop Mag, le HP Envy x360 avec Raven Ridge était un châssis réutilisé du catalogue HP, plutôt que quelque chose d’hyperoptimisé. Il est probable que la conception de référence d’AMD reflète beaucoup cette unité, car AMD et HP travaillent en étroite collaboration. Mais il y a clairement place à amélioration.

Pour ceux qui gardent une trace, encore une fois la ligne de base pour cette valeur est renvoyée à Kaveri. Kaveri établit également une barre basse ici, étant un processeur TDP de 19 W pour commencer, et Carrizo a beaucoup amélioré la métrique grâce à sa surveillance et à sa distribution d’énergie beaucoup plus optimisées. L’objectif est ici pour une valeur inférieure, alors que Kaveri a marqué une valeur de E de 1,00 comme ligne de base, Carrizo était de 0,35, Bristol Ridge était de 0,34, et Raven Ridge était de 0,28, et a également donné le double de la performance de Bristol Ridge. Quand est venu le temps de Renoir 2020, les performances étaient de + 75% par rapport à Picasso 2019, mais offraient également une puissance inférieure de 40% telle que mesurée par cette métrique, ce qui donne un gain global de 2,92x.

Pour quiconque se pose la question, l’équation de la ligne «objectif» se rapproche de:

Les données finales

Pour cette divulgation, AMD nous a communiqué toutes les données collectées. Nous avons dû envoyer quelques e-mails dans les deux sens, car certaines des données fournies par AMD étaient différentes de celles qui nous avaient été fournies dans les précédentes divulgations 25×20 – au-delà, il y avait des erreurs mathématiques à plusieurs endroits. AMD a pris un certain temps pour reconfirmer les bons chiffres et a admis qu’à la lumière de certains des problèmes que j’avais trouvés, les données précédentes pouvaient également être incorrectes (à un moment donné, ils avaient déplacé un point de données d’un processeur de 19 W à un 35 W CPU, entre autres problèmes).

Cela étant dit, voici toutes les plates-formes qu’AMD a utilisées pour l’objectif 25×20:

Systèmes AMD 25×20
CPU uArch Base/
Turbo
GPU
UC
GPU
Fréq
DDR
Fréq
TDP
Kaveri
2014
FX-7600P 2 x
Rouleau compresseur
2700
3600
8 x R7 686 2 x 4 Go
DDR3L-1600
35 W
Carrizo
2015
FX-8800P 2 x
Excavatrice
2100
3400
8 x R7 800 2 x 2 Go
DDR3-1866
35 W
Bristol
2016
FX-9830P 2 x
Excavatrice +
3000
3700
8 x R7 900 2 x 4 Go
DDR4-2133
35 W
Corbeau
2017
Ryzen 7
2700U
4 x
Zen
2200
3800
Vega10 1300 2 x 4 Go
DDR4-2400
15 W
Corbeau
2018
Ryzen 7
2800H
4 x
Zen
3300
3800
Vega11 1300 2 x 8 Go
DDR4-3200
35 W
Picasso
2019
Ryzen 7
3750H
4 x
Zen +
2300
4000
Vega10 1400 2 x 8 Go
DDR4-2400
35 W
Renoir
2020
Ryzen 7
4800H
8 x
Zen2
2900
4200
Vega8 1600 2 x 8 Go
DDR4-3200
35 W

Notez que certaines de ces plates-formes ne fonctionnent pas avec leurs désignations TDP standard. Cela a été fait pour l’unité au cours des années de performance (ce qui explique une certaine variation dans les résultats au fil des ans), Raven Ridge 2017 étant le seul point de données de 15 W en raison de l’emplacement de la pile de produits à l’époque. Le Ryzen 7 4800H, utilisé pour les tests Renoir, fonctionnait en mode 35W (essentiellement un 4800HS).

Et voici les résultats bruts, avec les colonnes clés mises en évidence:

AMD 25×20 Scores
AnandTech CB
R15 nT
3DM11 Calculer
(C)
ETEC Énergie
(E)
Performance
Efficacité (X)
Kaveri 2014 232 2142 1,00 0,931 1,00 1,00x
Carrizo 2015 277 2709 1,23 0,327 0,35 3,50x
Bristol 2016 279 3234 1,36 0,318 0,34 3,97x
Corbeau 2017 667 4425 2,47 0,261 0,28 8.81x
Corbeau 2018 754 4877 2,76 0,261 0,28 9.86x
Picasso 2019 772 5191 2,88 0,246 0,26 10,88x
Renoir 2020 1727 5546 5,02 0,147 0,16 31,77x

Globalement, AMD a réalisé un gain de performances de 5,02x avec une efficacité au repos de 6,33x, que la société intègre dans une métrique combinée d’efficacité de performance de 31,77x.

En parlant avec Sam Naffziger d’AMD, il a mentionné que lorsque ce projet a commencé, la société avait créé ce qu’elle pensait être les objectifs annuels du CPU et du GPU. En fin de compte, en 2014, AMD était très gros sur l’architecture du système hétérogène, essayant de fusionner le calcul du GPU avec le CPU. Bien que l’accélération GPU ait intégré certains aspects d’un appareil de style portable standard, elle n’est peut-être pas aussi omniprésente que ce qui était envisagé à l’origine, mais le résultat final a finalement été un gain distinct de CPU et de GPU. Sam m’a dit que sur la base de ces objectifs originaux en 2014/2015, AMD a dépassé ses projets dans le processeur d’une marge considérable, ce qui a compensé certaines des projections du GPU.

Sam a mentionné que l’un des éléments clés pour aider à atteindre cette mesure était le travail effectué par AMD dans la gestion de l’alimentation inactive, ce qui a une conséquence directe sur la durée de vie de la batterie d’utilisation d’un ordinateur portable standard. Étant donné que la partie «  efficacité  » du calcul est lourdement orientée vers le ralenti, la diminution de la latence pour qu’un CPU entre et quitte un mode turbo aide une machine à tourner au ralenti plus rapidement. En outre, l’optimisation des caractéristiques de tension de ce qui définit un état de veille et prenant en charge les états de puissance S0ix a également été un grand bond dans cette mesure. Les normes ACPI ont aidé à définir une partie de cette feuille de route, et certaines des exigences imposées par Microsoft afin d’activer certaines fonctionnalités ont fait avancer la conception.

AMD et x86 vs Arm

En passant, je voulais obtenir les réflexions de Sam sur la façon dont AMD aborde la concurrence croissante des conceptions basées sur Arm. Notez que nous avons eu ce briefing bien avant qu’Apple n’annonce sa récente actualité. Sam a déclaré que les conceptions de bras devaient encore pousser à la fois la fréquence et les performances dans le haut de gamme, ce qui nécessitera un travail considérable. Il a souligné la connaissance tribale de la conduite de x86 à haute performance et à grande échelle – bien qu’il ait reconnu que les partenaires d’Arm ont un certain nombre de conceptions de base et de SoC impressionnantes, et qu’ils gardent un œil sur ce que fait ce marché. En plus du travail de base, les partenaires d’Arm ont toujours la tâche de portage ISA / logiciel, et les transitions d’architecture doivent permettre de bénéficier d’avantages significatifs et de beaucoup d’investissement. Le point de vue de Sam est qu’AMD n’a pas l’intention de laisser se concrétiser un quelconque avantage à partir de l’espace Arm, et vise à garder une longueur d’avance à tout moment. Sam tenait à souligner qu’il pense que la concurrence est saine, et non à licencier Arm, mais à reconnaître qu’AMD vise à être en avance sur la courbe en cas de concurrence.

« Les cinq prochaines années vont être amusantes »

À ce stade, j’ai demandé à Sam si AMD avait un objectif similaire à 25×20 en tête pour les 5 à 10 prochaines années. Il était certes timide, disant qu’il y avait un autre objectif d’efficacité dans le plan, mais qu’il serait appliqué dans un contexte beaucoup plus large, en particulier avec la façon dont le monde a changé en ce qui concerne les exigences de calcul. Un tel objectif considérerait un certain nombre d’aspects de performance, peut-être liés à l’accélération de l’IA, mais irait également au-delà des ordinateurs portables dans le bureau et l’espace serveur – ces marchés ont des efforts de co-optimisation performances / énergie différents. Sam a déclaré qu’en fin de compte, AMD prévoit de se concentrer sur ce qui compte le plus pour les utilisateurs finaux, ce qui conduit à réduire la consommation d’énergie et ce qui peut offrir des gains environnementaux impressionnants à l’avenir.

On m’a dit qu’AMD n’allait pas s’asseoir sur ses lauriers de sitôt, quelle que soit sa position dans le paysage concurrentiel. L’objectif de projets comme 25×20 est de créer des changements de paradigme, en interne ou en externe, pour conduire à un niveau d’innovation continue en repoussant les limites. « Les cinq prochaines années vont être amusantes », a déclaré Sam.

AMD a également souligné son travail avec TSMC sur 7 nm, Sam déclarant que sans cela, la réalisation de l’objectif n’aurait pas été possible. À l’époque où le projet a commencé, il n’y avait pas d’indication claire sur les performances du 7 nm de TSMC, mais en étant un des premiers partenaires de TSMC et en approfondissant la conception et la co-optimisation technologique, AMD a été en mesure d’extraire ce qu’ils besoin du processus – sans ce travail, Sam prédit que AMD aurait à peine atteint 20x dans son objectif d’efficacité des performances. À l’avenir, AMD prévoit de continuer à être des partenaires principaux sur les technologies de nœuds de processus à venir.

Lecture connexe