Durant ces quatre dernières
années j'ai été le directeur
scientifique du Projet ASSO (2000-2003). L'objectif de ce projet d'EUROSTAT
impliquant 15 équipes provenant de 9 pays européens (Allemagne, Belgique,
Luxembourg, Grèce, Italie, Espagne, Portugal, France, Finlande), a été de
réaliser un logiciel prototype
d'analyse de données symboliques appelé SODAS* fournissant un cadre aux
différentes avancées récentes et futures du domaine. Son idée générale est la
suivante : à partir d'une base de données, construire un tableau de données
symboliques (parfois munies de règles et de taxonomies), modélisant des
catégories ou des concepts sous-jacents à la base, dans le but de décrire des
concepts résumant un vaste ensemble de données, analyser ensuite ce tableau
pour en extraire des connaissances par
des méthodes d'analyse de données symboliques qui contiennent comme cas
particulier les méthodes classiques de la statistique descriptive ou de l'analyse
des données exploratoires.
*Le logiciel SODAS issu de ce projet et d'un projet
européen antérieur (aussi piloté au plan scientifique par E. Diday de 97 à
2000), est public et peut être chargé à partir d'un site web http://www.ceremade.dauphine.fr/~touati/sodas-pagedarde.htm. Il contient des cours
en Power Point pour l'enseigner et le pratiquer (notice d'utilisation, mémoires
décrivant, à l'aide de diverses applications, les différentes étapes d'une
analyse de données symboliques).
Contrat
NSF-INRIA (2001-2003)
Je suis
le co-responsable de cette action avec le prof L. Billard de Georgia University
(USA). Ce contrat avec la NSF (National Science Fondation, USA) et l'INRIA a
pour objectif de développer certaines méthodes d'analyse de données
symboliques. Ce contrat prévoit entre autres une bourse pour un étudiant
américain afin de venir se former dans
notre équipe.
Valorisation :
contrats de recherche, partenariat industriel, créations d’entreprises
-
Le
projet européen ASSO (15 équipes de 9 pays, voir ci-dessus) dont je suis le pilote scientifique.
-
Le
contrat NSF (USA)- INRIA (Rocquencourt) dont je suis le responsable
scientifique avec le professeur L. Billard (UGA University).
-
Un
contrat en cours avec la MSA (Mutuelle Sociale Agricole, 4 millions d'assurés)
: les unités statistiques de leur base de données sont les feuilles de
maladies. Afin de mieux connaître le
comportement des assurés sociaux (dans le but d'améliorer la prise en charge,
par exemple), on a besoin de transformer cette base de façon que les nouvelles
unités statistiques soient les bénéficiaires. L'agrégation des feuilles de
maladies de chaque bénéficiaire sur une période donnée produit des variables
descriptives à valeur symbolique (intervalle, histogramme,…). On utilise donc
SODAS pour extraire de nouvelles connaissances de cette nouvelle base de
données symboliques.