Blog en direct AnandTech: les dernières mises à jour sont en haut. Cette page sera mise à jour automatiquement, il n’est pas nécessaire d’actualiser manuellement votre navigateur.
20 h 11 HAE – 2x efficacité
20 h 11 HAE – 3x en L1 BW, 2x casquette en vol
20 h 11 HAE – Nouvelle copie load-global-store-shared contournant le fichier de registre
20 h 11 HAE – A100 utilise des noyaux tenseurs à 32 fils pour réduire les instructions requises
20 h 10 HAE – Amélioration des vitesses et des avances, et de l’efficacité
20 h 10 HAE – 6K octets par horloge par SM pour sparse
20 h 10 HAE – Augmenter les augmentations de bande passante de données A100 en fonction des exigences de l’algorithme
20h09 HAE – FP32 utilise maintenant les OP TF32, prend en charge une amélioration 20x pour les données rares
20h09 HAE – Tensor core prend en charge plus de types de données
20h08 HAE – réseaux de taille fixe
20h08 HAE – A100 ciblé forte mise à l’échelle
20h08 HAE – chaque couche est parallélisée – A100 est 2,5x pour FP16 dense
20h07 HAE – Mise à l’échelle forte DL
20h07 HAE – Forte mise à l’échelle
20 h 06 HAE – Même gagne contre des jetons inédits
20 h 06 HAE – A100 domine également les performances par puce
20 h 06 HAE – Enregistrements sur MLPerf avec des pods A100
20 h 06 HAE – IEEE pour FP64 MatMul
20 h 05 HAE – Amélioration des performances par rapport au V100
20 h 05 HAE – Augmentation du mouvement de données asynchrone L1
20 h 05 HAE – Plus efficace, améliore les performances avec parcimonie
20 h 05 HAE – Tensor Core de nouvelle génération
20 h 04 HAE – Améliorations 2x-7x par rapport au V100 globalement
20 h 04 HAE – GPU élastique, évolutif avec NVLink de 3e génération
20 h 04 HAE – Bande passante HBM2 de 1,6 To / s
20 h 03 HAE – 6912 noyaux CUDA
20 h 03 HAE – A100: transistors 54-56B
20 h 03 HAE – Jack Choquette de NV
20h02 HAE – John Sell d’Intel, ex-Microsoft, est le président de la session
20 h 00 HAE – Question ouverte s’ils parleront d’Ampère pour des environnements autres que HPC, mais cette session porte également sur le « Gaming », donc on ne sait jamais
19 h 58 HE – Le premier discours sur la session GPU vient de NVIDIA, sur les performances de l’A100 et l’architecture Ampere