Hier, Arm a sorti les nouveaux processeurs Cortex-A78, Cortex-X1 et le nouveau GPU Mali-G78. Parallèlement aux nouvelles adresses IP «clés» de la société, nous avons également vu la révélation du plus récent NPU Ethos-N78, annonçant la nouvelle conception de deuxième génération d’Arm.

Au cours des dernières années, nous avons vu une explosion littérale d’accélérateurs d’apprentissage automatique dans l’industrie, avec un littéralement à l’ouest de différentes solutions IP. Sur le front mobile en particulier, il y a eu une énorme quantité de différentes solutions personnalisées développées en interne par les fournisseurs de SoC, cela inclut des conceptions telles que celles de Qualcomm, HiSilicon, MediaTek et Samsung LSI. Pour les fournisseurs qui n’ont pas la capacité de conception de déployer leur propre adresse IP, il est possible d’accorder une licence à un fournisseur IP tel qu’Arm.

L’apprentissage automatique IP «Ethos» d’Arm vise à déduire les charges de travail côté client, initialement décrites comme «Projet Trillium» et la première implémentation qui voit le jour sous la forme de l’Ethos-N77. Cela fait un an depuis la sortie de la première génération, et Arm a travaillé dur sur la prochaine itération de l’architecture. Aujourd’hui, nous couvrons l’architecture « Scylla » utilisée dans le nouvel Ethos-N78.

D’un point de vue très élevé, ce que le N78 promet est un coup de pouce assez important en termes de performances et d’efficacité. La nouvelle conception évolue beaucoup plus haut que la plus grande configuration N77, étant désormais en mesure d’offrir 2x les performances de pointe jusqu’à 10 To de débit de calcul brut.

Arm a remanié la conception du NPU pour une meilleure efficacité énergétique, grâce à diverses nouvelles techniques de compression ainsi qu’à une amélioration de la bande passante de la mémoire externe par inférence allant jusqu’à 40%.

Les points forts du N78 sont la capacité de l’IP à adapter les performances à différentes options de configuration. L’IP est disponible à 4 points de performance différents, ou mieux à quatre configurations de moteur distinctes différentes, de la plus petite configuration à 1TOP, à 2, 5 et enfin un maximum de 10TOP. Cela correspond à des configurations MAC de 512, 1024, 2048 et 4096 unités pour la totalité de la conception.

L’aspect intéressant d’une mise à l’échelle plus grande est que l’efficacité de la zone de l’IP évolue en fait mieux avec la taille de l’implémentation, en raison probablement du fait que le pourcentage de zone de blocs de fonctions partagés fixes uniques diminue avec le plus de moteurs de calcul de la conception.

Sur le plan architectural, les plus grandes améliorations du nouveau N78 ont été dans la façon dont il traite les données dans les moteurs, permettant de nouvelles méthodes de compression pour les données qui sortent non seulement du NPU (amélioration de la bande passante DRAM), mais aussi du mouvement des données au sein du NPU lui-même, améliorant efficacité pour les performances et la puissance.

La nouvelle compression et la gestion des données peuvent réduire considérablement la bande passante du système avec une réduction moyenne de 40% sur les charges de travail – ce qui est un chiffre extrêmement impressionnant à mettre en évidence entre les générations IP.

Les augmentations de performances générationnelles, grâce à la densité de performances et à l’efficacité énergétique plus élevées sont en moyenne de 25%, ce qui, avec la configuration de performances de pointe doublée, signifie qu’il a le potentiel de représenter une forte augmentation des appareils finaux.

Il est assez difficile d’analyser les NPU sur leurs performances dans le paysage concurrentiel – en particulier ici dans le cas d’Arm étant donné que nous n’avons pas encore vu les conceptions de NPU de première génération en silicium. Une remarque intéressante qu’Arm a faite, c’est que dans cet espace, le logiciel compte plus que toute autre chose, et une mauvaise pile logicielle peut éventuellement ruiner ce qui autrement serait une bonne conception matérielle. Arm a mentionné avoir vu des fournisseurs adopter leur propre IP Ethos et abandonner les conceptions de leurs concurrents à cause de cela – Arm dit qu’ils investissent une très grande quantité de ressources dans les logiciels afin de faciliter aux clients d’utiliser correctement leurs conceptions matérielles.

Le nouveau Ethos-N78 d’Arm a déjà été concédé sous licence aux clients et ils sont en train d’enregistrer leurs conceptions avec, avec probablement les premiers produits voyant le jour en 2021 au plus tôt.

Lecture connexe: