WeData a sollicité la CNIL (Commission Nationale de l’Informatique et des Libertés) pour analyser le statut de sa méthode d’anonymisation : les « avatars ». Les avatars sont des données de synthèses anonymes, issues d’une simulation mathématique. En juin 2020, après avoir expertisé la solution Avatar, la CNIL atteste la conformité de la méthode de WeData. L’évaluation de la CNIL s’est basée sur la capacité de la méthode à respecter les trois critères décrits dans l’avis du G29 de 05/2014 à savoir, l’individualisation, la corrélation et l’inférence.
Le problème : comment résoudre le paradoxe entre la protection des données des patients et l’enjeu majeur que représente le partage des données ?
La protection des données personnelles s’est renforcée depuis la mise en place du règlement général sur la protection des données (RGPD, risque d’amende 4% du CA annuel). Les méthodes improprement appelées « d’anonymisation » favorisent soit le respect de la vie privée au détriment de la qualité (méthode d’agrégation, masquage…) soit la qualité aux dépens de la confidentialité. Comment concilier le respect des droits et libertés de chacun et permettre l’exploitation des données ?
La solution : des données anonymes et statistiquement pertinentes : les avatars
La méthode Avatar développée par WeData propose une approche différenciante et innovante issue d’un programme de recherche et développement avec une forte ambition scientifique et technologique. La méthode de simulation stochastique personnalisée résout le paradoxe entre la protection des données personnelles des patients et le partage de ces données pour leur valeur informative. Les avatars sont une innovation de rupture car ils permettent de ne pas choisir entre le partage des données personnelles et la protection des individus à l’origine des données. Les avatars transforment les données personnelles des patients en données de synthèse anonymes mais statistiquement pertinentes.
Quelle est la proposition de valeur de la méthode Avatar ?
Elle est issue d’une orientation conceptuelle technique centrée sur le patient. Elle offre une combinaison unique d’avantages :
- La sécurité: grâce à une authentique solution d’anonymisation, certifiée par la CNIL, permettant d’assurer la confidentialité des données d’origine et donc leur partage sans risque.
- La reproductibilité des analyses : grâce à des données anonymes mais statistiquement pertinentes. Les avatars conservent la granularité des données initiales. Cette caractéristique permet d’utiliser les données générées comme s’il s’agissait de données originales et sans restriction y compris pour des analyses statistiques complexes ou nouveaux (analyses multivariées, modèles de prédiction…).
A quoi servent les avatars ?
La méthode offre des bénéfices d’usage exclusifs pour ses clients et permet de nouveaux usages dans le respect du RGPD :
- Sécuriser ses données en utilisant, à la place des données d’origine, des jeux de données de synthèse, qui assurent le respect de la vie privée des individus.
- Permettre le partage et donc l’exploitation des données, en sécurité, grâce aux avatars qui maintiennent la pertinence statistique des jeux de données.
- Conserver une trace informative des données indépendamment de la durée de conservation imposée par le RGPD.
Les avatars permettent de répondre à un impératif éthique mettant à profit les données au service de l’innovation et de la recherche.
En savoir plus : L’évaluation de la CNIL et ses 3 critères
D’abord, il est important de rappeler la différence entre les données anonymes et pseudonymes car elles sont souvent confondues.
– La pseudonymisation consiste à remplacer les données directement identifiantes (nom, prénom, etc.) d’un jeu de données par des données indirectement identifiantes (alias, numéro dans un classement, etc.) empêchant ainsi la réidentification directe des individus. En pratique, des données pseudonymisées restent potentiellement réidentifiantes par croisement d’informations (âge, sexe, code postal). Cette transformation est donc réversible justifiant le fait que des données pseudonymisées soient toujours considérées comme des données personnelles.
– L’anonymisation consiste à utiliser des techniques de façon à rendre impossible, en pratique, la réidentification des individus à l’origine des données personnelles anonymisées. Ce traitement a un caractère irréversible qui implique que les données anonymisées ne sont plus des données personnelles, sortant ainsi du cadre d’application du RGPD.
L’évaluation de la CNIL sur la méthode des avatars de WeData s’est basée sur les 3 critères énoncés dans l’avis du G29 de 05/2014 :
- Individualisation: les données anonymes ne permettent pas l’individualisation (donc l’appropriation des informations et leur identification). Ce volet de conformité est vérifié par des métriques innovantes de protection issues de la méthode. Ces métriques sont uniques et résultent du principe conceptuel de patient centrisme.
- Corrélation: les données anonymes ne peuvent pas non plus être ré-identifiées en les croisant avec d’autres jeux de données puisqu’avec les avatars, toutes les données directement ou indirectement identifiantes sont modifiées.
- Inférence: les avatars ne permettent pas de déduire de l’information additionnelle sur un individu de façon raisonnable, étant donné qu’ils ne sont liés à aucun individu.
En savoir plus : La méthode d’Avatarisation.
Ci-dessous la publication de demande de brevet sur les avatars.
A propos de WeData
WeData, startup nantaise, labélisée Deeptech par BPI, accompagnée par Atlanpole, membre d’Atlanpole Bioptherapies, lauréat de réseau Entreprendre Atlantique et incubée dans chez Novapuls. Sa méthode innovante d’anonymisation « Avatar », attestée par la CNIL, est déjà utilisée par le CHU de Nantes, dans le projet européen HAP2 porté par le Pr Antoine Roquilly et dans l’industrie pharma. La méthode est commercialisée sous forme de logiciel (on premise) ou de vente en ligne d’avatars.
Pour plus d’informations : https://wedata.science/
Fondateur : Olivier BREILLACQ