18 h 04 HAE – Ceci est la première conférence sur l’informatique de pointe
18 h 05 HAE – Xuantie-910 d’Alibaba
18 h 06 HAE – Innovation Cloud et Edge Computing par RISC-V
18 h 06 HAE – Xuantie fait référence à une épée lourde du folklore chinois en fer
18 h 07 HAE – T-Head semiconductor – une jeune organisation Alibaba spécialisée dans la conception de circuits spécialisée dans le calcul de nouvelle génération pour divers domaines avec un fort engagement envers l’Open Source
18h08 HAE – RISC-V est très attractif pour l’ère de l’IoT
18h08 HAE – L’extensibilité et la modularité permettent la personnalisation des charges de travail spécifiques au domaine
18h09 HAE – Plateforme RISC-V Mainline sous Linux, entièrement prise en charge dans AlibabaOS
18h09 HAE – L’objectif de Xuantie est de contribuer à la communauté oepn source
18h09 HAE – Moteur vectoriel AI
18 h 10 HAE – Performances similaires à Arm 73
18 h 10 HAE – Xuantie-902 (M0 + like) avec matériel TEE jusqu’à Xuantie-910
18 h 10 HAE – 903, 907,908 à venir
18 h 11 HAE – 4 cœurs par cluster en 910
18 h 11 HAE – Cluster HMP
18 h 11 HAE – Chaque noyau prend en charge 32-64 KB L1 D et 32-64 KB L1 I
18 h 11 HAE – Chaque cœur est un OoO à 3 décodages et 8 numéros
18 h 11 HAE – Prédicteur de branche hybride
18 h 11 HAE – moteur vectoriel
18 h 12 HAE – L’un des premiers processeurs commerciaux à utiliser les propositions d’extension de vecteur RISC-V
18 h 12 HAE – Performances sur Coremark 7,1 par MHz. Cette charge de travail est un hit de cache complet uniquement
18 h 13 HAE – RISC-V le plus performant actuellement sur le marché
18 h 13 HAE – SiFive a un processeur U84 qui pourrait être plus performant, mais pas encore de détails
18 h 13 HAE – attendre que les informations deviennent disponibles
18 h 13 HAE – X910 prend en charge l’extension de vecteur RISC-V 0.7.1
18 h 13 HAE – FP16-FP64, INT8-INT64
18 h 14 HAE – MMX, Clint, PPC
18 h 14 HAE – MMU *
18 h 14 HAE – Prend en charge l’accès aux données mémoire non alignées
18 h 14 HAE – Prend en charge les extensions personnalisées
18 h 14 HAE – Extensions RISC-V Turbo
18 h 15 HAE – opérations sur les bits, accès à la mémoire, synchronisation du cœur
18 h 15 HAE – Peut être désactivé pour être complètement compatible avec RISC-V
18 h 15 HAE – mais la chaîne d’outils Alibaba peut utiliser les nouvelles instructions
18 h 16 HAE – Deux tubes vectoriels, 1 ALU / MUL, 1 ALU / DIV, 1 branche, 1 unité de chargement / stockage à double émission
18 h 16 HAE – Unité de récupération d’instructions 128 bits
18 h 16 HAE – peut récupérer 8 instructions à la fois
18 h 17 HAE – Prédiction de branchement multimode hybride
18 h 17 HAE – Prédiction Cache Way
18 h 17 HAE – Accélérateur de boucle
18 h 18 HAE – Peut faire une charge et un magasin en parallèle
18 h 18 HAE – 3 cycles de charge à l’utilisation
18 h 19 HAE – Mode de prélecture multi-mode et multi-flux unique pour RISC-V par correspondance de modèle et remplit le cache L1 / L2
18 h 19 HAE – 4 cœurs par cluster, jusqu’à 4 clusters
18 h 20 HAE – Tous les clusters partagent L2, jusqu’à 8 Mo
18 h 20 HAE – Deux opérations / cycle Vector ALU 128 bits
18 h 21 HAE – Plus de 300 GFLOP FP16 par cluster (32 FLOP / cœur / cycle x 2,5 GHz x 4 cœurs)
18 h 21 HAE – La performance FP32 est 0,5x FP16
18 h 21 HAE – Donc 150 GFLOP de FP32 par cluster – jusqu’à 600 GFLOP de FP32 dans une conception à 4 clusters
18 h 22 HAE – Egalement intégré IDE avec profilage pour Xuantie-910
18 h 22 HAE – Le compilateur a été co-optimisé pour les améliorations matérielles
18 h 22 HAE – Par rapport au bras A73
18 h 23 HAE – Le processeur A73 provient de Huawei Kirin 970
18 h 23 HAE – Xuantie est configuré pour les mêmes tailles de cache L1
18 h 24 HAE – ‘à égalité dans cette config’
18 h 24 HAE – Les benchmarks ne signifient pas que Xuantie-910 est à la perfection de A73, car il est encore nouveau et nécessite plus de collaboration
18 h 25 HAE – Voici une charge de travail IA
18 h 25 HAE – sur une simulation FPGA de X910
18 h 25 HAE – Voici un plan d’étage
18 h 26 HAE – TSMC 12FF
18 h 26 HAE – FPGA X910 déjà déployé dans le cloud Alibaba
18 h 27 HAE – FPGA fonctionne à 200 MHz
18 h 27 HAE – 28 juillet 2020 version HPC à 1,6 GHz, 0,3 mW / MHz
18 h 27 HAE – FinFET 12nm en septembre
18 h 28 HAE – Aidez les clients externes avec X910 avec la plate-forme SoC Wujian
18h30 HAE – Maintenant pour les questions et réponses
18 h 32 HAE – Q: Pour quelles applications l’utilisez-vous?
18 h 33 HAE – R: C’est une puce complète – un cœur haut de gamme pour les SoC embarqués
18 h 34 HAE – Q: code source? R: nous travaillons activement sur des procédures open source. Ce n’est pas simple pour un noyau haute performance – requis par la loi. Nous parlons aux entreprises open source pour trouver la meilleure façon de le faire. Aussi la gestion des référentiels et autres. Une fois disponible, nous vous le ferons savoir!
18 h 34 HAE – Q: prévoit de prendre en charge RVV 1.0? R: 0.7.1 pour le moment – quand nous avons conçu, c’était toujours à ce niveau. Nous suivons et travaillons sur le chapeau oui.
18 h 36 HAE – C’est une enveloppe. Mon prochain blog en direct sera NVIDIA A100 à 17h PT.