Aujourd’hui, Google a annoncé l’introduction prévue de son nouvel ensemble de VM « Tau », ou T2D, dans ses offres de VM Google Compute Engine. Le matériel se compose des nouveaux processeurs Milan d’AMD, ce qui est un ajout bienvenu aux offres de Google.

Cependant, la plus grande nouvelle de l’annonce d’aujourd’hui n’était pas Milan, mais le fait de ce que Google fait en termes de processeurs virtuels, son impact sur les performances et les conséquences que cela a dans l’espace des fournisseurs de cloud, en particulier dans le contexte du nouveau concours de processeurs de serveur Arm. .

En commençant par le point de données le plus important que Google présente aujourd’hui, les nouvelles machines virtuelles GCP Tau présentent un avantage de performances stupéfiant par rapport aux offres concurrentes d’AWS et d’Azure. Les comparaisons des VMs sont publiées ici :

La méthodologie SPECrate2017_int de Google imite largement notre propre utilisation interne de la suite de tests en termes d’indicateurs (quelques différences comme le LTO et la liaison d’allocateur), mais le chiffre le plus important provient de la divulgation des compilateurs, Google déclarant que le +56 % l’avantage de performances par rapport à Graviton2 d’AWS provient d’une exécution AOCC. Ils divulguent en outre qu’une exécution GCC atteint un avantage de performance de 25 %, ce qui clarifie certains aspects :

Notez que nous avons également testé avec GCC en utilisant -O3, mais nous avons constaté de meilleures performances avec -Ofast sur toutes les machines testées. Une note intéressante est que, bien que nous ayons constaté une augmentation des performances estimée à 56 % de SPECrate®2017_int_base sur le t2d-standard-32 par rapport au m6g.8xlarge lorsque nous avons utilisé le compilateur d’optimisation d’AMD, qui pourrait tirer parti de l’architecture AMD, nous avons également constaté une augmentation de 25 % % d’amélioration des performances sur le t2d-standard-32 par rapport au m6g.8xlarge lors de l’utilisation de GCC 11.1 avec les indicateurs ci-dessus pour les deux machines.

Ayant ce chiffre de 25 % à l’esprit, nous pouvons nous rabattre sur nos propres données testées en interne sur le Graviton2 ainsi que sur le produit phare d’AMD Milan plus récemment testé pour un positionnement approximatif de la situation :

Google ne divulgue aucun détail sur le type de SKU qu’ils testent, mais nous avons des données vCPU 64 cœurs et 32 ​​cœurs sur Graviton2, marquant des scores estimés de 169,9 et 97,8 avec des scores par thread de 2,65 et 2,16. Nos numéros internes d’un processeur AMD EPYC 7763 (64 cœurs 280W) présentent un score estimé de 255 taux et 1,99 par thread avec SMT, et 219 taux et 3,43 par thread pour respectivement 128 threads et 64 threads par socket. La réduction des scores sur la base d’un nombre de threads de 32 – sur la base de ce que Google déclare ici en tant que processeurs virtuels pour l’instance T2D, nous amènerait à des scores de 63,8 avec SMT ou de 109,8 sans SMT. L’exécution SMT avec 32 threads serait nettement moins performante que Graviton2, mais l’exécution non SMT serait +12 plus performante. Nous estimons que les scores réels dans un environnement de 32 processeurs virtuels avec moins de charge sur le reste du SoC seraient nettement plus élevés, ce qui correspondrait à peu près à l’avantage de performance de +25 cité par l’entreprise.

Et c’est là que réside la grande surprise de l’annonce d’aujourd’hui : pour que les nouveaux chiffres de performances de Google à Milan aient un sens, cela doit signifier qu’ils utilisent des instances avec des nombres de processeurs virtuels qui correspondent réellement au nombre de cœurs physiques – ce qui a de grandes implications sur l’analyse comparative et les comparaisons de performances entre les instances d’un nombre égal de processeurs virtuels.

Notamment, parce que Google se concentre sur la comparaison Graviton2 chez AWS, je vois cela comme une attaque directe et une réponse aux revendications de métriques de performances cloud d’Amazon et d’Arm concernant les machines virtuelles avec un nombre donné de vCPU. En effet, même lorsque nous avons examiné le Graviton2 l’année dernière, nous avons noté cet écart lors de la comparaison des offres de VM cloud à l’offre cloud x86 qui ont SMT et où un vCPU signifie essentiellement que vous obtenez un cœur logique au lieu d’un cœur physique, comme sur le nouveau Graviton2 basé sur Arm. En effet, nous avions comparé les processeurs Arm avec le double du nombre de cœurs par rapport aux titulaires x86 aux mêmes tailles d’instance. En fait, c’est toujours ce que Google fait aujourd’hui lorsqu’il compare une machine virtuelle 32vCPU Milan Tau à une machine virtuelle Azure 32vCPU Cascade Lake – il s’agit d’une comparaison 32 cœurs contre 16 cœurs, seule cette dernière a SMT activé.

Étant donné que Google nivelle désormais les règles du jeu par rapport aux instances de VM Graviton2 basées sur Arm à nombre égal de processeurs virtuels, en ayant en fait le même nombre de cœurs physiques disponibles, cela signifie qu’il n’a aucun problème à rivaliser en termes de performances avec le concurrent Arm , et naturellement, il surpasse également les autres options de fournisseur de cloud où un vCPU n’est toujours qu’un processeur SMT logique.

Google propose une instance T2D 32vCPU avec 128 Go de RAM à 1,35 USD par heure, par rapport à une instance AWS comparable de m6g.8xlarge avec également 32vCPU et 128 Go de RAM à 1,23 USD par heure. Bien que l’utilisation de l’AOCC par Google pour atteindre les chiffres de performance les plus élevés par rapport à nos chiffres GCC joue un certain rôle et que les performances de Milan soient excellentes, c’est vraiment le fait que nous semblons maintenant comparer les cœurs physiques aux cœurs physiques qui fait vraiment la nouvelle VM Tau instances spéciales par rapport aux offres AWS et Azure (physique à logique dans ce dernier cas).

En général, j’applaudis Google pour l’initiative ici, car jusqu’à présent, ne proposer qu’une partie d’un cœur en tant que vCPU était une arnaque complète. Dans un sens, nous devons également remercier le nouveau concours Arm d’avoir finalement amené l’écosystème à provoquer ce qui semble être le début de la fin de ces pratiques vCPU et offres de VM discutables. Cela n’aurait pas non plus été possible sans les nouvelles offres de processeurs à grand nombre de cœurs d’AMD. Il sera intéressant de voir comment AWS et Azure réagiront à l’avenir, car je pense que Google met fin au marché du cloud en termes de prix et de valeur.

Lecture connexe :