Lorsqu’il existe une volonté d’obtenir des performances supplémentaires d’un processeur, il existe souvent un moyen. Que ce soit par l’overclocking de l’utilisateur final ou par les fournisseurs de cartes mères qui peaufinent les paramètres pour améliorer les performances de leur stock, en fin de compte, tout le monde veut de meilleures performances, et pour une multitude de raisons. Cet entraînement insatiable pour des performances de pointe, cependant, signifie que certains de ces ajustements et ajustements peuvent commencer à contourner ce qui est «dans les spécifications». Et en conséquence, nous voyons parfois des méthodes d’augmentation des performances du processeur qui tiennent clairement leurs promesses, mais peut-être au détriment des thermiques ou de la longévité.

À cette fin, il est récemment apparu que les fournisseurs de cartes mères profitaient d’un paramètre sur les cartes mères AMD pour déformer le courant délivré au processeur. Ce faisant, ils sont capables d’augmenter la marge de puissance du processeur et, finalement, de permettre des performances plus élevées au prix de thermiques plus élevés. Certes, ce type de peaufinage n’est pas nouveau, mais les événements récents n’ont pas manqué de confusion sur ce qui se passe exactement et sur les ramifications des processeurs AMD Ryzen. Donc, pour essayer de clarifier les choses, voici notre point de vue sur la situation.

The Old Fashioned Way: Spread Spectrum, MultiCore Enhancement, PL2

L’un des thèmes communs que j’ai remarqué tout au long de mon séjour chez AnandTech en tant qu’éditeur de carte mère et maintenant notre éditeur de processeur est la longueur à laquelle les fournisseurs de cartes mères iront afin d’obtenir des performances accrues par rapport à la concurrence. Nous avons été le premier point de vente à sortir des fonctionnalités telles que MultiCore Enhancement, en août 2012, qui a conduit à des fréquences tous les cœurs plus élevées que spécifiées, ou dans certains cas, à des sur-horloges. Mais l’histoire des fournisseurs de cartes mères ajustant et ajustant les fonctionnalités pour les performances remonte plus loin que cela, telles que les variations de la fréquence de base de 100 MHz à 104,7 MHz avec le Spread Spectrum, conduisant à une augmentation des performances sur les systèmes qui peuvent la prendre en charge.

Plus récemment, sur les plates-formes Intel, nous avons vu des fournisseurs augmenter leurs limites de puissance turbo afin que la carte mère puisse soutenir le turbo le plus élevé aussi longtemps que le monde existe, simplement parce que les fournisseurs de cartes mères surorganisent la fourniture d’énergie afin de prendre en charge il. Au cours des deux dernières semaines, nous avons également trouvé des exemples de cartes mères ignorant les nouvelles exigences d’Intel Thermal Velocity Boost, ce que nous approfondirons dans un prochain article.

En bref, les fournisseurs de cartes mères veulent être les meilleurs, ce qui signifie souvent repousser les limites de ce qui est considéré comme la «spécification de base» du processeur. Comme nous en avons régulièrement discuté sur des sujets comme celui-ci avec les limites de puissance turbo d’Intel, la différenciation entre une «  spécification  » et un «  paramètre recommandé  » peut devenir assez floue – pour Intel, la puissance turbo répertoriée dans les documents est un paramètre recommandé, et toute valeur de la carte mère est techniquement «dans les spécifications». Il semble que Intel considère l’overclocking si la fréquence turbo maximale est augmentée.

Ajuster AM4 au-dessus et au-delà

Alors maintenant, nous passons aux nouvelles du jour, les fabricants de cartes mères tentant maintenant de modifier les cartes mères Ryzen basées sur AMD afin d’améliorer les performances. Comme expliqué en détail sur les forums HWiNFO par The Stilt et résumé ici, les plates-formes AM4 ont généralement trois limiteurs définis: Package Power Tracking (PPT), qui indique le seuil de puissance autorisé à être livré au socket; Le courant de conception thermique (TDC), qui est le courant maximal délivré par les régulateurs de tension des cartes mères sous les limites thermiques; et le courant de conception électrique (EDC), qui est le courant maximal à tout moment qui peut être délivré par les régulateurs de tension. Certaines de ces valeurs sont comparées à des métriques dérivées en interne dans le CPU ou en externe dans la distribution d’alimentation, pour voir si ces limites ont été déclenchées.

Afin de calculer la mesure de puissance logicielle à laquelle PPT est comparé, le coprocesseur de gestion de puissance prend la valeur du courant du contrôleur de gestion du régulateur de tension. Ce n’est pas une valeur réelle de courant, mais une valeur sans dimension (0 à 255) conçue pour représenter 0 = 0 ampères et 255 = ampères de crête que les VRM peuvent gérer. Le coprocesseur de gestion de l’alimentation sur le CPU effectue alors son calcul de puissance (puissance en watts = tension en volts multipliée par le courant en ampères).

La plage de valeurs sans dimension doit être calibrée sur une disposition par carte mère, en fonction des composants utilisés (VRM, contrôleurs) ainsi que du traçage, des couches de carte et de la qualité de la conception. Afin d’obtenir une valeur de mise à l’échelle précise pour cette plage sans dimension, un fournisseur de carte mère doit sonder avec précision les valeurs correctes, puis écrire le micrologiciel pour utiliser cette table de recherche dans les calculs de puissance du système.

Cela signifie qu’il existe un moyen potentiel de jouer avec la façon dont le système interprète la valeur de puissance de crête du processeur. Les fournisseurs de cartes mères peuvent réduire cette valeur sans dimension du courant afin que le processeur et le coprocesseur de gestion de l’alimentation pensent qu’il y a moins de puissance vers le CPU et, par conséquent, le limiteur de suivi de puissance du package (PPT) n’a pas encore été atteint, et plus de puissance peut être fournie. Cela permet au processeur de turbo plus que ce qui était initialement prévu par AMD.

Cela a des effets d’entraînement. Le processeur consommera plus d’énergie, principalement sous la forme d’ampérages accrus, ce qui entraînera une production de chaleur accrue et une augmentation de la chaleur. Étant donné que le processeur évolue davantage (en étant autorisé à consommer plus d’énergie que ce que le logiciel rapporte), le processeur fonctionnera également mieux dans les tests de performance.

Comme le souligne The Stilt, si vous utilisez un CPU avec un TDP de base de 105 W et une valeur PPT de 142 W, dans des circonstances normales, vous devriez vous attendre à voir 142 W de puissance rapportée par le CPU aux paramètres de stock. Cependant, si la valeur du courant sans dimension n’est que de 75% de son courant réel, alors la consommation électrique réelle est en fait d’environ 190 W, ce qui correspond à la valeur de 142 W divisée par le facteur 0,75. En supposant qu’aucune des autres limites n’a été atteinte (TDC, EDC), le processeur ne rapportera que 75% de la puissance PPT d’origine, provoquant beaucoup de confusion.

Est-ce hors spécifications?

Si nous considérons PPT, TDC et EDC comme étant les spécifications AMD pour la consommation électrique et la consommation de courant, alors oui, cela est hors spécifications. Cependant, le PPT, par sa nature même, va au-delà du TDP, nous entrons donc dans ce monde mystérieux de la définition du « turbo », similaire à ce que nous avons couvert en détail avec Intel.

Comme nous l’avons déjà expliqué, dans Intel Land, la puissance de pointe consommée en mode turbo n’est fournie par Intel qu’aux fournisseurs de cartes mères en tant que «valeur recommandée». En conséquence, les puces Intel accepteront en fait toute valeur pour cette limite de puissance de pointe, y compris des valeurs raisonnables comme 200 W ou 500 W, mais même des valeurs déraisonnables comme 4000 W. Plus souvent qu’autrement (et selon le processeur), une puce peut frapper d’autres limites d’abord; mais pour les modèles haut de gamme, cela vaut certainement la peine d’être suivi. Pendant ce temps, la durée du turbo, Tau, qui définit la taille du seau d’énergie que Turbo peut tirer, peut également être étendue: au lieu de la valeur par défaut comprise entre 8 et 56 secondes, Tau peut être étendu à ce qui est en fait une quantité infinie temps. Selon Intel, tout est conforme aux spécifications, si les fabricants de cartes mères peuvent construire des cartes qui peuvent le fournir.

Ce que Intel considère hors spécifications, c’est lorsque le processeur dépasse les fréquences répertoriées dans les tableaux turbo pour Turbo Boost 2.0 (ou TBM 3.0, ou Thermal Velocity Boost). Lorsque le processeur fonctionne au-dessus de la fréquence définie par les tables turbo, Intel prend en compte cet overclocking et n’a aucune obligation de respecter la garantie de la puce.

Le problème est que même si nous pouvons essayer de transposer les mêmes règles dans la situation AMD, AMD n’utilise pas vraiment les Turbo Tables en tant que telles. Les processeurs AMD fonctionnent en essayant d’offrir la fréquence la plus élevée possible compte tenu des limites de puissance et de courant à tout moment. Plus il y a de cœurs, plus la puissance par cœur diminue et la fréquence globale diminue. Nous entrons dans les moindres détails du suivi de l’enveloppe de fréquence, qui peut devenir plus complexe étant donné qu’AMD peut fonctionner par pas de 25 MHz plutôt que par pas de 100 MHz comme Intel.

AMD utilise également des fonctionnalités qui poussent la fréquence d’une puce au-dessus de la fréquence turbo indiquée sur la page des spécifications. Si vous vouliez discuter strictement de l’overclocking, alors à en juger par le nombre sur la boîte, cela pourrait très bien l’être. AMD brouille délibérément les lignes ici, mais l’avantage est souvent plus de performances.

Mon processeur est-il en danger?

Pour répondre à la grande question dès le départ, non, votre processeur n’est pas en danger. Pour les utilisateurs réguliers avec suffisamment de refroidissement fonctionnant à la fréquence des stocks, il n’y a aucun problème qui importera pendant la durée de vie prévue du produit.

La plupart des processeurs x86 modernes sont livrés avec une garantie de trois ans pour les pièces en boîte au détail, ou sont vendus comme pièces OEM avec une garantie d’un an. Au-delà de ces périodes d’assistance, alors qu’AMD ou Intel ne remplaceront pas le processeur en cas de panne, la plupart des processeurs devraient bien vivre dans la plage des 15 ans et plus. Nous sommes toujours très heureusement en mesure de tester les anciens processeurs sur les anciennes cartes mères, même s’ils sont hors service depuis longtemps (et le plus souvent, ce sont les anciens condensateurs de la carte mère qui ont tendance à exploser, pas le CPU).

Lorsqu’une tranche de CPU sort de la chaîne de fabrication, la société obtient un rapport de fiabilité sur ces processeurs, ce qui permet d’avoir une idée des possibilités de regroupement de ces CPU. Cela comprendra des éléments tels que la réponse tension / fréquence, mais aussi en ce qui concerne l’électromigration.

Mis à part les dommages physiques ou les limites thermiques désactivées et la cuisson du CPU lui-même, le principal moyen pour un processeur moderne de devenir non fonctionnel est par électromigration. Il s’agit de l’acte des électrons qui se frayent un chemin à travers les fils d’un processeur et qui se heurtent très légèrement au silicium (et à d’autres éléments) dans ce fil pour les faire sortir du réseau cristallin. C’est en soi un événement assez rare (depuis combien de temps vos fils sont-ils dans votre maison, par exemple), mais à petite échelle, cela peut affecter le changement de fonctionnement d’un processeur.


Adapté de « Electromigration » par Linear77, Licence: CC BY 3.0

En déplaçant un atome de silicium hors de sa place dans un réseau cristallin, la section transversale du fil, à ce point, est réduite. Cela augmente la résistance, car la résistance est inversement proportionnelle à la section transversale du fil. Si suffisamment d’atomes de silicium sont déplacés, le fil se déconnecte et le processeur n’est plus utilisable.

La quantité d’électromigration augmente dans certaines conditions – température, utilisation et tension. L’un des principaux moyens de surmonter la résistance accrue consiste à augmenter la tension, ce qui à son tour augmente la température du processeur. Il devient une boucle de rétroaction négative pour la durée de vie du processeur.

Avec une tension plus élevée (énergie par électron), et une densité de courant plus élevée (électrons par unité de surface), cette signifie qu’il y a plus de chances qu’un événement de migration d’électrons se produise. Cela peut empirer à des températures plus élevées, et tous ces éléments agissent comme des facteurs différents lorsqu’il s’agit de la quantité d’électrons qui pourraient avoir suffisamment d’énergie pour permettre un événement d’électromigration. Pour quiconque étudie la cinétique de réaction, c’est un principe similaire à la concentration mais avec une énergie variable par incident.

C’est donc mauvais, non? Eh bien, c’était le cas auparavant. Comme les fabricants de processeurs et les fabricants de semi-conducteurs ont itéré à travers la conception de portes logiques dans les processeurs CMOS et FinFET, des contre-mesures actives ont été mises en place pour réduire les niveaux d’électromigration (ou réduire l’effet des niveaux d’électromigration). À mesure que nous rétrécissons les nœuds de processus et que les tensions diminuent, cela devient également moins problématique – le fait que les fils diminuent également en surface a l’effet inverse. Mais comme mentionné, les fabricants prennent désormais activement des mesures pour réduire l’effet de l’électromigration à l’intérieur d’un processeur.

L’électromigration n’a pas été un problème pour la plupart des produits semi-conducteurs grand public depuis longtemps. La seule fois où j’ai personnellement été touché par des problèmes d’électromigration, c’est lorsque je possédais un Core i7-2600K 2011 basé sur Sandy Bridge, que j’utilisais pour des compétitions d’overclocking à 5,1 GHz dans certains scénarios de refroidissement extrêmes. Il est finalement arrivé à un point, après quelques années, où il avait besoin de plus de tension pour fonctionner en stock.

Mais c’était un processeur que j’ai couru jusqu’au bord déchiqueté. L’équipement moderne est conçu pour fonctionner pendant une décennie ou plus. Ce que nous voyons avec ces chiffres, bien qu’il y ait une augmentation des thermiques en raison de l’augmentation de la puissance, n’est pas en fait un changement considérable. Dans le rapport de The Stilt, parce que le processeur voit qu’il a une marge de puissance supplémentaire, il augmente légèrement la tension afin d’obtenir le supplément de +75 MHz que le budget permettra, ce qui augmente la tension moyenne de 1,32 volt à 1,38 volt pendant une CineBench R20 run. La tension de crête, qui compte beaucoup pour l’électromigration, ne passe que de 1,41 volt à 1,42 volt. La puissance globale a été augmentée de 25 W, ce qui représente environ 30A de plus. Pas quelque chose de l’ordre d’un changement dans l’ordre de grandeur.

Donc, si je me retrouve avec une carte mère qui ajuste cette valeur actuelle perçue, est-ce que cela brique mon processeur? Non, sauf si vous avez quelque chose d’autre qui ne va vraiment pas avec votre configuration (comme les thermiques). Dans la durée de vie donnée de ce produit, et la prochaine décennie après, il est peu probable qu’il fasse une différence. Et comme indiqué précédemment, même si cela affectait l’électromigration à grande échelle, les fabricants de processeurs ont intégré des mécanismes pour y faire face. Le seul moyen de le surveiller activement, en tant qu’utilisateur final, serait d’observer vos valeurs de tension moyenne et de crête au cours des années et de voir si le processeur s’ajuste automatiquement pour compenser.

Il convient peut-être de mentionner que la valeur actuelle sans dimension n’est pas réglable par l’utilisateur final – c’est quelque chose que la carte mère contrôle via les mises à jour du BIOS. Si vous êtes un utilisateur qui surhorloge, vous faites plus vers l’électromigration que cet ajustement ne le fera jamais. Pour ceux qui sont préoccupés par les thermiques, je soupçonne que vous surveillez et ajustez déjà vos limites de BIOS selon les besoins de votre système.

Comment vérifier si ma carte mère le fait

Tout d’abord, vous devez exécuter un système de stock. La modification de l’un des PPT / TDC / EDC normaux signifie déjà que le système est en cours d’ajustement, nous devons donc nous concentrer uniquement sur les utilisateurs traitant des systèmes de stock.

Ensuite, acquérez la dernière version de HWiNFO et un test qui entraînera une charge de 100% sur le système, tel que CineBench R20.

À l’intérieur de HWiNFO, il y a une métrique appelée «Écart de rapport de puissance du processeur». Observez ce nombre lorsque le système est à pleine charge. Une carte mère normale devrait dire «100%», tandis qu’une carte mère avec une valeur rapportée actuelle / VRM ajustée dira quelque chose en dessous de 100%.

Juste pour clarifier, cette métrique n’est valide que:

  1. Si votre processeur AMD Ryzen fonctionne avec les paramètres de stock complets dans le BIOS. Aucun OC, aucun ajustement des limites de puissance ou de courant.
  2. Lorsque votre CPU fonctionne à pleine charge à 100%, comme Cinebench.

Si votre processeur ne correspond pas à ces deux exigences, la valeur de la déviation de rapport d’alimentation ne signifie rien. S’il indique moins de 100%, votre carte mère est affectée. Veuillez nous en informer dans les commentaires ci-dessous.

Quelles sont mes options?

Si votre carte mère utilise le processeur, mais que vous êtes satisfait des performances thermiques de votre refroidisseur et de la puissance absorbée par le mur, profitez des performances supplémentaires. Même si ce n’est que 75 MHz.

AMD n’a pas nécessairement besoin de commenter la question, car il s’agit d’un problème avec les fabricants de cartes mères. Les utilisateurs peuvent vouloir sonder le fabricant de leur carte mère et demander une mise à jour du BIOS. Les utilisateurs qui souhaitent retourner leur carte mère devront vérifier auprès de leur revendeur, car cela peut dépendre de l’endroit où il a été acheté.

Étant donné que si cela semble casser les spécifications PPT, cela ne va pas au-delà des spécifications de fréquence (qui sont mal définies), cela peut être similaire à la façon dont les fabricants de cartes mères jouent avec les limites de puissance sur les systèmes Intel, c’est-à-dire que c’est quelque chose c’est « juste là ». Bien qu’il serait probablement utile d’obtenir une option BIOS pour l’activer / la désactiver.

Lecture connexe