Rechercher

Presidio

Début: 10-02-2015
Fin: 10-02-2019
Convention: DGCIS

 Investissements d’Avenir - Développement de l’Economie Numérique
« Informatique en nuage – Cloud Computing et Big Data »

---

PRESIDIO
PREdiction des événements de Santé par le bIg Data chez une cohorte de patients atteints de depressIOn

---

Construction d’un modèle innovant d’exploration et de prise en charge des maladies chroniques par le Big Data : Prédiction de la survenue d’événement de santé chez des personnes atteintes de dépression par l’analyse de données issues des réseaux sociaux, des bases de données en santé et de la géolocalisation

Participants

CEDRIC

Michel Bera
Responsable

Description

Kappa Santé : KS Temis : TM
Business & Decision : B&D Digital & Ethics : D&E
SNIPS : SP INSERM U897 : U897
Laboratoire CEDRIC – CNAM : CNAM

---

Mesure quantitative des risques de ré-identification et de démutualisation

Le Cnam (laboratoire CECRIC) se propose de construire, en étroite collaboration avec Digital Ethics qui constitue la partie « quali » de l’approche éthique du projet, un certain nombre d’outils de mesure quantitative des risques associés aux problématiques et aux risques cités ci-dessus.

Ce travail s’effectuera dans le même esprit actuariel (3 piliers) que celui qui a présidé à la naissance des travaux de type Bâle ou Solvabilité pour le calcul et la gouvernance des provisions financières à mettre dans les bilans des banques et compagnies d’assurance face aux crises de type subprimes.

Le Cnam propose de définir une méthodologie de gouvernance liée aux risques d’utilisation et de croisements de données réalisés dans le cadre du projet PRESIDIO :

- 1-a Définir et normaliser (modèles standards) des modèles de mesure (quantification) du risque de ré-identification d’un jeu de données, particulièrement en présence des croisements de jeux de données prévus et des traitements statistiques associés ;

- 1-b Evaluer les méthodologies déjà existantes (état de l’art dans le Monde), méthodologies utilisées sur les sujets les plus proches de PRESIDIO ;

- 1-c Proposer des méthodes (ex : floutage, micro-aggrégation) capables de diminuer les risques mesurés, tout en conservant la qualité des modélisations effectuées ;

- 2-a Préciser les méthodes permettant l’audit des calculs suscités par un tiers

- 2-b Rédiger les formations de tiers amenés à contrôler éventuellement le bien fondé des calculs présentés (comme les futurs CILs devenus des « commissaires aux données ») ;

- 3 Publier les résultats et faire connaître l’approche retenue, nouvelle gouvernance des algorithmes et des données utilisées.

Pour ce faire, le CNAM travaillera en étroite collaboration avec les partenaires du projet, mais aussi avec les autorités de tutelle qui pourraient être concernées (IdS, CNIL).