Blog en direct AnandTech: les dernières mises à jour sont en haut. Cette page sera mise à jour automatiquement, il n’est pas nécessaire d’actualiser manuellement votre navigateur.

20 h 11 HAE – 2x efficacité

20 h 11 HAE – 3x en L1 BW, 2x casquette en vol

20 h 11 HAE – Nouvelle copie load-global-store-shared contournant le fichier de registre

20 h 11 HAE – A100 utilise des noyaux tenseurs à 32 fils pour réduire les instructions requises

20 h 10 HAE – Amélioration des vitesses et des avances, et de l’efficacité

20 h 10 HAE – 6K octets par horloge par SM pour sparse

20 h 10 HAE – Augmenter les augmentations de bande passante de données A100 en fonction des exigences de l’algorithme

20h09 HAE – FP32 utilise maintenant les OP TF32, prend en charge une amélioration 20x pour les données rares

20h09 HAE – Tensor core prend en charge plus de types de données

20h08 HAE – réseaux de taille fixe

20h08 HAE – A100 ciblé forte mise à l’échelle

20h08 HAE – chaque couche est parallélisée – A100 est 2,5x pour FP16 dense

20h07 HAE – Mise à l’échelle forte DL

20h07 HAE – Forte mise à l’échelle

20 h 06 HAE – Même gagne contre des jetons inédits

20 h 06 HAE – A100 domine également les performances par puce

20 h 06 HAE – Enregistrements sur MLPerf avec des pods A100

20 h 06 HAE – IEEE pour FP64 MatMul

20 h 05 HAE – Amélioration des performances par rapport au V100

20 h 05 HAE – Augmentation du mouvement de données asynchrone L1

20 h 05 HAE – Plus efficace, améliore les performances avec parcimonie

20 h 05 HAE – Tensor Core de nouvelle génération

20 h 04 HAE – Améliorations 2x-7x par rapport au V100 globalement

20 h 04 HAE – GPU élastique, évolutif avec NVLink de 3e génération

20 h 04 HAE – Bande passante HBM2 de 1,6 To / s

20 h 03 HAE – 6912 noyaux CUDA

20 h 03 HAE – A100: transistors 54-56B

20 h 03 HAE – Jack Choquette de NV

20h02 HAE – John Sell d’Intel, ex-Microsoft, est le président de la session

20 h 00 HAE – Question ouverte s’ils parleront d’Ampère pour des environnements autres que HPC, mais cette session porte également sur le «  Gaming  », donc on ne sait jamais

19 h 58 HE – Le premier discours sur la session GPU vient de NVIDIA, sur les performances de l’A100 et l’architecture Ampere