Problèmes d’estimation, de sélection de variables et de tests sous contraintes de confidentialité différentielle locale
Dans cet exposé, on s’intéressera à différents problèmes d’inférence statistique sous contrainte de confidentialité des données. Le cadre choisi est celui de la confidentialité différentielle locale, notion introduite en 2006 pour permettre de réaliser des analyses statistiques tout en fournissant des garanties de protection des données personnelles analysées.
Après avoir introduit la notion de confidentialité différentielle locale, on s’intéressera à l’estimation non-paramétrique d’une densité de probabilité. Nous étudierons le risque minimax L_r sur les ellipsoïdes de Besov et nous intéresserons à l’adaptation au paramètre de régularité.
On s’intéressera ensuite à l’identification du support de l’espérance d’une variable aléatoire suivant une loi normale multidimensionnelle. Sous des hypothèses de sparsité, nous étudierons le risque minimax lié à la distance de Hamming et nous en déduirons des conditions nécessaires et suffisantes pour que l’identification du support soit possible.
Si il reste du temps, j’aborderai aussi un problème de tests d’adéquations pour des densités höldériennes.
Dans chacun de ces cadres, l’objectif est d’étudier l’impact des contraintes de confidentialité des données sur les performances statistiques.
Le séminaire se déroulera en présentiel et sera retransmis via une session BigBlueButton. Un lien sera envoyé jeudi matin.