Projets de recherche

Présentation

Recherches

Publications

Encadrement

 

 

Le Projet Européen ASSO

 

Durant ces quatre dernières années j'ai  été le directeur scientifique du Projet ASSO (2000-2003). L'objectif de ce projet d'EUROSTAT impliquant 15 équipes provenant de 9 pays européens (Allemagne, Belgique, Luxembourg, Grèce, Italie, Espagne, Portugal, France, Finlande), a été de réaliser un  logiciel prototype d'analyse de données symboliques appelé SODAS* fournissant un cadre aux différentes avancées récentes et futures du domaine. Son idée générale est la suivante : à partir d'une base de données, construire un tableau de données symboliques (parfois munies de règles et de taxonomies), modélisant des catégories ou des concepts sous-jacents à la base, dans le but de décrire des concepts résumant un vaste ensemble de données, analyser ensuite ce tableau pour en extraire des connaissances  par des méthodes d'analyse de données symboliques qui contiennent comme cas particulier les méthodes classiques de la statistique descriptive ou de l'analyse des données exploratoires.

*Le logiciel SODAS issu de ce projet et d'un projet européen antérieur (aussi piloté au plan scientifique par E. Diday de 97 à 2000), est public et peut être chargé à partir d'un site web http://www.ceremade.dauphine.fr/~touati/sodas-pagedarde.htm. Il contient des cours en Power Point pour l'enseigner et le pratiquer (notice d'utilisation, mémoires décrivant, à l'aide de diverses applications, les différentes étapes d'une analyse de données symboliques).

 

Contrat NSF-INRIA (2001-2003)

Je suis le co-responsable de cette action avec le prof L. Billard de Georgia University (USA). Ce contrat avec la NSF (National Science Fondation, USA) et l'INRIA a pour objectif de développer certaines méthodes d'analyse de données symboliques. Ce contrat prévoit entre autres une bourse pour un étudiant américain afin de  venir se former dans notre équipe.

 

Valorisation : contrats de recherche, partenariat industriel, créations d’entreprises

 

-         Le projet européen ASSO (15 équipes de 9 pays, voir ci-dessus)  dont je suis le pilote scientifique.

 

-         Le contrat NSF (USA)- INRIA (Rocquencourt) dont je suis le responsable scientifique avec le professeur L. Billard (UGA University).

 

-         Un contrat en cours avec la MSA (Mutuelle Sociale Agricole, 4 millions d'assurés) : les unités statistiques de leur base de données sont les feuilles de maladies.  Afin de mieux connaître le comportement des assurés sociaux (dans le but d'améliorer la prise en charge, par exemple), on a besoin de transformer cette base de façon que les nouvelles unités statistiques soient les bénéficiaires. L'agrégation des feuilles de maladies de chaque bénéficiaire sur une période donnée produit des variables descriptives à valeur symbolique (intervalle, histogramme,…). On utilise donc SODAS pour extraire de nouvelles connaissances de cette nouvelle base de données symboliques.