18 h 04 HAE – Ceci est la première conférence sur l’informatique de pointe

18 h 05 HAE – Xuantie-910 d’Alibaba

18 h 06 HAE – Innovation Cloud et Edge Computing par RISC-V

18 h 06 HAE – Xuantie fait référence à une épée lourde du folklore chinois en fer

18 h 07 HAE – T-Head semiconductor – une jeune organisation Alibaba spécialisée dans la conception de circuits spécialisée dans le calcul de nouvelle génération pour divers domaines avec un fort engagement envers l’Open Source

18h08 HAE – RISC-V est très attractif pour l’ère de l’IoT

18h08 HAE – L’extensibilité et la modularité permettent la personnalisation des charges de travail spécifiques au domaine

18h09 HAE – Plateforme RISC-V Mainline sous Linux, entièrement prise en charge dans AlibabaOS

18h09 HAE – L’objectif de Xuantie est de contribuer à la communauté oepn source

18h09 HAE – Moteur vectoriel AI

18 h 10 HAE – Performances similaires à Arm 73

18 h 10 HAE – Xuantie-902 (M0 + like) avec matériel TEE jusqu’à Xuantie-910

18 h 10 HAE – 903, 907,908 à venir

18 h 11 HAE – 4 cœurs par cluster en 910

18 h 11 HAE – Cluster HMP

18 h 11 HAE – Chaque noyau prend en charge 32-64 KB L1 D et 32-64 KB L1 I

18 h 11 HAE – Chaque cœur est un OoO à 3 décodages et 8 numéros

18 h 11 HAE – Prédicteur de branche hybride

18 h 11 HAE – moteur vectoriel

18 h 12 HAE – L’un des premiers processeurs commerciaux à utiliser les propositions d’extension de vecteur RISC-V

18 h 12 HAE – Performances sur Coremark 7,1 par MHz. Cette charge de travail est un hit de cache complet uniquement

18 h 13 HAE – RISC-V le plus performant actuellement sur le marché

18 h 13 HAE – SiFive a un processeur U84 qui pourrait être plus performant, mais pas encore de détails

18 h 13 HAE – attendre que les informations deviennent disponibles

18 h 13 HAE – X910 prend en charge l’extension de vecteur RISC-V 0.7.1

18 h 13 HAE – FP16-FP64, INT8-INT64

18 h 14 HAE – MMX, Clint, PPC

18 h 14 HAE – MMU *

18 h 14 HAE – Prend en charge l’accès aux données mémoire non alignées

18 h 14 HAE – Prend en charge les extensions personnalisées

18 h 14 HAE – Extensions RISC-V Turbo

18 h 15 HAE – opérations sur les bits, accès à la mémoire, synchronisation du cœur

18 h 15 HAE – Peut être désactivé pour être complètement compatible avec RISC-V

18 h 15 HAE – mais la chaîne d’outils Alibaba peut utiliser les nouvelles instructions

18 h 16 HAE – Deux tubes vectoriels, 1 ALU / MUL, 1 ALU / DIV, 1 branche, 1 unité de chargement / stockage à double émission

18 h 16 HAE – Unité de récupération d’instructions 128 bits

18 h 16 HAE – peut récupérer 8 instructions à la fois

18 h 17 HAE – Prédiction de branchement multimode hybride

18 h 17 HAE – Prédiction Cache Way

18 h 17 HAE – Accélérateur de boucle

18 h 18 HAE – Peut faire une charge et un magasin en parallèle

18 h 18 HAE – 3 cycles de charge à l’utilisation

18 h 19 HAE – Mode de prélecture multi-mode et multi-flux unique pour RISC-V par correspondance de modèle et remplit le cache L1 / L2

18 h 19 HAE – 4 cœurs par cluster, jusqu’à 4 clusters

18 h 20 HAE – Tous les clusters partagent L2, jusqu’à 8 Mo

18 h 20 HAE – Deux opérations / cycle Vector ALU 128 bits

18 h 21 HAE – Plus de 300 GFLOP FP16 par cluster (32 FLOP / cœur / cycle x 2,5 GHz x 4 cœurs)

18 h 21 HAE – La performance FP32 est 0,5x FP16

18 h 21 HAE – Donc 150 GFLOP de FP32 par cluster – jusqu’à 600 GFLOP de FP32 dans une conception à 4 clusters

18 h 22 HAE – Egalement intégré IDE avec profilage pour Xuantie-910

18 h 22 HAE – Le compilateur a été co-optimisé pour les améliorations matérielles

18 h 22 HAE – Par rapport au bras A73

18 h 23 HAE – Le processeur A73 provient de Huawei Kirin 970

18 h 23 HAE – Xuantie est configuré pour les mêmes tailles de cache L1

18 h 24 HAE – ‘à égalité dans cette config’

18 h 24 HAE – Les benchmarks ne signifient pas que Xuantie-910 est à la perfection de A73, car il est encore nouveau et nécessite plus de collaboration

18 h 25 HAE – Voici une charge de travail IA

18 h 25 HAE – sur une simulation FPGA de X910

18 h 25 HAE – Voici un plan d’étage

18 h 26 HAE – TSMC 12FF

18 h 26 HAE – FPGA X910 déjà déployé dans le cloud Alibaba

18 h 27 HAE – FPGA fonctionne à 200 MHz

18 h 27 HAE – 28 juillet 2020 version HPC à 1,6 GHz, 0,3 mW / MHz

18 h 27 HAE – FinFET 12nm en septembre

18 h 28 HAE – Aidez les clients externes avec X910 avec la plate-forme SoC Wujian

18h30 HAE – Maintenant pour les questions et réponses

18 h 32 HAE – Q: Pour quelles applications l’utilisez-vous?

18 h 33 HAE – R: C’est une puce complète – un cœur haut de gamme pour les SoC embarqués

18 h 34 HAE – Q: code source? R: nous travaillons activement sur des procédures open source. Ce n’est pas simple pour un noyau haute performance – requis par la loi. Nous parlons aux entreprises open source pour trouver la meilleure façon de le faire. Aussi la gestion des référentiels et autres. Une fois disponible, nous vous le ferons savoir!

18 h 34 HAE – Q: prévoit de prendre en charge RVV 1.0? R: 0.7.1 pour le moment – quand nous avons conçu, c’était toujours à ce niveau. Nous suivons et travaillons sur le chapeau oui.

18 h 36 HAE – C’est une enveloppe. Mon prochain blog en direct sera NVIDIA A100 à 17h PT.