Clustering par partitions multiples (INSA salle 16 bâtiment 18)

Nous traiterons de la question du clustering lorsque plusieurs variables latentes de classes sont considérées (clustering par partitions multiples). Une première approche suppose l'existence de plusieurs groupes de variables, chacun conduisant à une partition particulière des individus [1]. Le modèle suppose l'indépendance entre les blocs de variables, et dans chaque bloc l'indépendance des variables conditionnellement à la classe. Nous proposons une recherche simultanée des blocs de variables et des partitions associées des individus en classes, ce qui permet d’explorer efficacement l’espace des modèles. Une seconde approche suppose l'existence de plusieurs projections classifiantes dans les données [2]. Le modèle suppose que les données sont obtenues à partir de combinaisons linéaires de variables classifiantes et non classifiantes, où chaque variable classifiante est supposée suivre une distribution de mélange spécifique. Les paramètres des modèles sont estimés par un algorithme EM généralisé.

[1] Marbac, M. and Vandewalle, V. (2019). “A tractable multi-partitions clustering”. In: Computational Statistics & Data Analysis 132, pp. 167–179.
[2] Vandewalle, V. (2020). “Multi-Partitions Subspace Clustering”. In: Mathematics 8.4, p. 597.