Licence Mi2E 2011/2012

NOISE : Nouveaux outils informatiques

pour la statistique exploRatoire

 Statistique exploratoire et numérique

Ch. Robert

Buts

Ce cours vise à apprendre aux étudiant(e)s l'emploi (aisé) d'un logiciel appelé  R, version libre (et gratuite) du logiciel S-plus, le "S" se rapportant à "Statistics". Plutot que de faire un cours d'informatique "pur(e)", nous avons préféré fonder cet apprentissage sur des notions de base de Statistique exploratoire, c'est à dire d'analyse statistique de données sans hypothèse(s) forte(s) de modelisation.

Le cours emploiera donc le logiciel R à profusion, mais les bases de programmation en R seront abordées uniquement durant les TPs. Les etudiant(e)s seront encourage(e)s à télécharger le logiciel, disponible sur le site de R, sur leur propre machine (versions Linux, Unix, Windows et Mac disponibles). Une introduction sommaire a R est fournie dans un poly, mais les etudiant(e)s sont vivement encourage(e)s a acheter [ou telecharger] les references donnees ci-dessous. (Investissement recommande : ce logiciel est suffisant pour le traitement de la plupart des problemes statistiques !!!)

L'evaluation des connaissances se fera par un examen en ligne (version 2009) début janvier 2011 (rattrapage en septembre): l'examen se fera en salle surveillée et en temps limité et consistera en des questionnaires à choix multiples argumentés par des programmes R

Les documents du cours de l'an dernier sont disponibles sur la page Intercours du cours de Statistique exploratoire, y compris l'examen de 2008/2009 et un poly en anglais pour les 3 premiers chapitres.

English version

Cette année, sous réserve d'un nombre suffisant de volontaires, un groupe de Td sera assuré en anglais par Christian Robert, à la fois pour le cours et pour les communications enseignant/étudiant. 

Contacts:    Enseignants : Sophie Donnet donnet [arobas] ceremade.dauphine.fr, Merlin Keller, merlinkeller [arobas] gmail.com Alessandra Iacobucci iacob [arobas] ceremade.dauphine.fr, Robin Ryder ryder [arobas] ceremade.dauphine.fr, Sofia Tsepletidou sofia_ts [arobas] hotmail.com et Christian Robert, Bureau B638, xian [arobas] ceremade.dauphine.fr


Plan

Les transparents du cours sont disponibles sur cette page et distribues à l'avance. De même pour les feuilles de Tp.

1. Bases de la simulation non uniforme [transparents][transparents a imprimer]

2.  Methodes de Monte Carlo pour l'integration et l'optimisation [Applet HM][transparents][transparents a imprimer]

3.  Methodes de bootstrap pour l'estimation et les tests [notes par Effron][transparents][transparents a imprimer]

4. Methodes non-parametriques en estimation et tests [transparents][transparents a imprimer]


Cours et Tps

Le cours est un cours-td-tp qui a lieu en salle machine uniquement, groupe par groupe, à l'exception du cours introductif en amphi.


Livres de reference:

De nombreux polys sont disponibles sur le Net. Voir la page "The R manuals" sur le site de R.
  • R. Drouihlet, P. Lafaye de Micheaux et B. Liquet (2010) Le logiciel R Springer, Paris
  • C. Robert et G. Casella (2010) Méthodes de Monte-Carlo avec R Springer, Paris
  • M. Crawley (2002) Statistical Computing: An Introduction to Data Analysis Using S-PLUS Wiley, New York
  • M. Crawley (2002) Statistical Computing: An Introduction to Data Analysis Using S-PLUS Wiley, New York 
  • A. Kraus et M. Olson (2000)The Basics of S and S-PLUS (second edition) Springer-Verlag, New York 
  • W. Venable (1992) Notes on S-PLUS: A Programming Environment for Data Analysis and Graphics. Disponible on-line   
  • W. Venables  and B.D. Ripley (1999) Modern Applied Statistics with S-PLUS, Third edition, Springer, New York, NY


  • Programmes R

    Les programmes ci-dessous correspondent à des illustrations fournies en cours:

  • slice sampler
  • vraisemblance de melange
  • Data augmentation pour melange
  • EM pour melange
  • modele d'epidemie
  • voyageur de commerce (fichier townz)
  • Questions ?