Lorsqu’on considère la confidentialité et la protection des données, aucune donnée n’est plus importante que les données personnelles, qu’elles soient médicales, financières ou même sociales. Les discussions autour de l’accès à nos données, ou même à nos métadonnées, portent sur qui sait quoi et si mes données personnelles sont en sécurité. L’annonce d’aujourd’hui entre Intel, Microsoft et DARPA est un programme conçu pour protéger et chiffrer les informations, tout en continuant d’utiliser ces données pour créer de meilleurs modèles ou fournir une meilleure analyse statistique sans divulguer les données réelles. C’est ce qu’on appelle le cryptage entièrement homomorphe, mais il est si intense en calcul que le concept est presque inutile en pratique. Ce programme entre les trois sociétés est un moteur pour fournir IP et silicium pour accélérer le calcul, permettant un environnement plus sécurisé pour l’analyse collaborative des données.

Faites attention à vos données

La protection des données est l’un des aspects les plus importants de l’avenir de l’informatique. Le volume de données personnelles est en constante augmentation, ainsi que la valeur de ces données et le nombre de protections juridiques requises. Cela rend tout traitement de données personnelles, privées et confidentielles difficile, ce qui entraîne souvent des silos de données dédiés, car tout traitement nécessite un transfert de données couplé à un cryptage / décryptage, impliquant une confiance qui n’est pas toujours possible. Tout ce qu’il faut, c’est qu’une clé de la chaîne soit perdue ou divulguée, et l’ensemble de données est compromis.

Il existe un moyen de contourner ce problème, connu sous le nom de cryptage entièrement homomorphe (FHE). FHE permet de prendre des données cryptées, de les transférer là où elles doivent aller, d’effectuer des calculs dessus et d’obtenir des résultats sans jamais connaître l’ensemble de données sous-jacent exact.

Prenons, par exemple, l’analyse des enregistrements de données médicales: si un chercheur a besoin de traiter un ensemble de données spécifique pour une analyse, la méthode traditionnelle serait de crypter les données, d’envoyer les données, de décrypter les données et de les traiter – mais en donnant au chercheur l’accès aux détails des dossiers peut ne pas être légal ou faire face à des défis réglementaires. Avec FHE, ce chercheur peut prendre les données cryptées, effectuer l’analyse et obtenir un résultat, sans jamais connaître les spécificités de l’ensemble de données. Cela peut impliquer une analyse statistique combinée d’une population sur plusieurs ensembles de données cryptés, ou prendre ces ensembles de données cryptées et les utiliser comme entrées supplémentaires pour former des algorithmes d’apprentissage automatique, améliorant ainsi la précision en ayant plus de données. Bien sûr, le chercheur doit avoir confiance que les données fournies sont complètes et authentiques, mais il s’agit sans doute d’un sujet différent de celui de permettre le calcul sur des données cryptées.

L’un des problèmes pour savoir pourquoi cela est important est que les meilleures informations à partir des données proviennent des plus grands ensembles de données. Cela inclut la possibilité de former un réseau de neurones, et les meilleurs réseaux de neurones se heurtent à des problèmes de manque de données ou sont confrontés à des obstacles réglementaires en ce qui concerne la nature sensible de ces données. C’est pourquoi le cryptage entièrement homomorphe, la capacité d’analyser les données sans en connaître le contenu, est important.

Le cryptage entièrement homomorphe, en tant que concept, existe depuis plusieurs décennies, mais le concept n’a été réalisé qu’au cours des 20 dernières années environ. Un certain nombre de schémas de chiffrement homomorphiques partiels ont été présentés au cours de cette période initiale, et depuis 2010, plusieurs conceptions PHE / FHE capables de traiter des opérations de base sur des données chiffrées ou des textes chiffrés ont été développées avec un certain nombre de bibliothèques développées selon les normes de l’industrie. Certains d’entre eux sont open source. Un grand nombre de ces méthodes sont complexes en termes de calcul pour des raisons évidentes en raison du traitement des données cryptées, bien que des efforts soient faits avec un emballage de type SIMD et d’autres fonctionnalités pour accélérer le traitement. Même si les schémas FHE sont accélérés, ce n’est pas la même chose que le décryptage, car le calcul ne décrypte pas les données – parce que les données sont toujours dans un état crypté, elles peuvent (sans doute) être utilisées par des tiers non fiables en tant que les informations sous-jacentes ne sont jamais exposées. (On pourrait soutenir qu’un ensemble de données suffisant pourrait révéler plus que prévu malgré le chiffrement.)

Annonce d’aujourd’hui: Silicium personnalisé pour FHE

Lors de la mesure des performances du calcul FHE, le résultat est comparé à la même analyse par rapport à la version en texte brut des données. En raison de la complexité de calcul du calcul FHE, les méthodes de calcul actuelles sont nettement plus lentes. Les méthodes de chiffrement pour activer FHE peuvent augmenter la taille des données de 100 à 1000x, puis calculer sur ces données est de 10000x à 1 million de fois plus lent que le calcul conventionnel. Cela signifie qu’une seconde de calcul sur les données brutes peut prendre de 3 heures à 12 jours.

Qu’il s’agisse de combiner les dossiers médicaux des hôpitaux sur un état ou de personnaliser un service personnel à l’aide de métadonnées personnelles recueillies sur le smartphone d’un utilisateur, FHE à cette échelle n’est plus une solution viable. Entrez dans le programme DARPA DPRIVE.

  • DARPA: Agence des projets de recherche avancée de défense
  • DPRIVE: protection des données dans les environnements virtuels

Intel a annoncé que dans le cadre du programme DPRIVE, il a signé un accord avec DARPA pour développer une adresse IP personnalisée menant au silicium afin de permettre une FHE plus rapide dans le cloud, en particulier avec Microsoft sur Azure et JEDI cloud, initialement avec le gouvernement américain. Dans le cadre de ce projet pluriannuel, l’expertise d’Intel Labs, d’Intel Design Engineering et d’Intel Data Platforms Group se réunira pour créer un ASIC dédié afin de réduire la surcharge de calcul de FHE par rapport aux méthodes CPU existantes. Le communiqué de presse indique que l’objectif est de réduire le temps de traitement de cinq ordres de grandeur par rapport aux méthodes actuelles, réduisant les temps de calcul de quelques jours à quelques minutes.

Intel a déjà un pied dans la porte en ce qui concerne FHE, ayant une équipe de recherche au sein d’Intel Labs dédiée à la question. Cela a principalement été du côté des logiciels, des normes et des obstacles réglementaires, mais passera désormais également à la conception matérielle, aux piles de logiciels cloud et au déploiement collaboratif au sein d’Azure et du cloud JEDI pour le gouvernement américain. Les autres marchés cibles mis en évidence comprennent la santé, l’assurance et la finance.

Lors de la journée Intel Labs en décembre 2020, Intel a détaillé une partie de la direction dans laquelle il s’engageait déjà avec ce travail, ainsi que des normes et un développement pour paralléliser le cryptage traditionnel mais à une échelle internationale compte tenu des obstacles réglementaires supplémentaires. Microsoft fera désormais partie de cette discussion avec le programme DPRIVE, ainsi que les investissements continus d’Intel au niveau universitaire.

Hormis l’élément des «cinq ordres de grandeur», l’annonce d’aujourd’hui ne va pas au-delà de cela en créant des objectifs définitifs, et ne présente pas non plus de calendrier, mais en disant plutôt qu’il s’agit d’un accord «pluriannuel». Il sera intéressant de voir combien Intel ou ses affiliations académiques discutent sur le sujet au-delà d’aujourd’hui, au-delà de la normalisation du travail.

Lecture connexe