Licence Mi2E 2009/2010

NOISE : Nouveaux outils informatiques

pour la statistique exploRatoire

Ch. Robert

Buts

Ce cours vise à apprendre aux étudiant(e)s l'emploi (aisé) d'un logiciel appelé  R, version libre (et gratuite) du logiciel S-plus, le "S" se rapportant à "Statistics". Plutot que de faire un cours d'informatique "pur(e)", nous avons préféré fonder cet apprentissage sur des notions de base de Statistique exploratoire, c'est à dire d'analyse statistique de données sans hypothèse(s) forte(s) de modelisation.

Le cours emploiera donc le logiciel R à profusion, mais les bases de programmation en R seront abordées uniquement durant les TPs. Les etudiant(e)s seront encourage(e)s à télécharger le logiciel, disponible sur le site de R, sur leur propre machine (versions Linux, Unix, Windows et Mac disponibles). Une introduction sommaire a R est fournie dans un poly, mais les etudiant(e)s sont vivement encourage(e)s a acheter [ou telecharger] les references donnees ci-dessous. (Investissement recommande : ce logiciel est suffisant pour le traitement de la plupart des problemes statistiques !!!)

L'evaluation des connaissances se fera par un examen en ligne début janvier 2010 : l'examen se fera en salle surveillée et en temps limité et consistera en des questionnaires à choix multiples argumentés par des programmes R

Les documents du cours sont désormais disponibles sur la page Intercours du cours de Statistique exploratoire, y compris l'examen de 2008/2009 et un poly en anglais pour les 3 premiers chapitres.

English version

Cette année, sous réserve d'un nombre suffisant de volontaires, un groupe de Td sera assuré en anglais par Christian Robert, à la fois pour le cours et pour les communications enseignant/étudiant. 

Contacts:    Enseignants : Julyan Arbel julyan.arbel [arobas] gmail.com, Nicolas Bousquet nicolas.bousquet [arobas] edf.fr,  Marie Chanchole Marie.Chanchole [arobas] ensae.fr,, Sophie Donnet, donnet [arobas] ceremade.dauphine.fr Alessandra Iacobucci iacob [arobas] ceremade.dauphine.fr, et Christian Robert, Bureau B638, xian [arobas] ceremade.dauphine.fr


Plan

Les transparents du cours sont disponibles sur cette page et distribues à l'avance. De même pour les feuilles de Tp.

1. Bases de la simulation non uniforme [transparents][transparents a imprimer]

2.  Methodes de Monte Carlo pour l'integration et l'optimisation [Applet HM][transparents][transparents a imprimer]

3.  Methodes de bootstrap pour l'estimation et les tests [notes par Effron][transparents][transparents a imprimer]

4. Methodes non-parametriques en estimation et tests [transparents][transparents a imprimer]


Cours et Tps

Le cours est un cours-td-tp qui a lieu en salle machine uniquement, groupe par groupe, à l'exception du cours introductif en amphi.


Livres de reference:

De nombreux polys sont disponibles sur le Net. Voir la page "The R manuals" sur le site de R. S'il faut conseiller un ouvrage, le Crawley et le Venables-Ripley sont tres adaptes au cours.
 
  • M. Crawley (2002) Statistical Computing: An Introduction to Data Analysis Using S-PLUS Wiley, New York

  • [commande a la bibliotheque et en vente a la librairie Privat]
     
  • A. Kraus et M. Olson (2000)The Basics of S and S-PLUS (second edition) Springer-Verlag, New York

  • [commande a la bibliotheque et en vente a la librairie Privat]
     
  • W. Venable (1992) Notes on S-PLUS: A Programming Environment for

  • Data Analysis and Graphics. Disponible on-line
     
  • W. Venables  and B.D. Ripley (1999) Modern Applied Statistics with S-PLUS, Third edition, Springer, New York, NY

  • [commande a la bibliotheque]


    Programmes R

    Les programmes ci-dessous correspondent à des illustrations fournies en cours:

  • slice sampler
  • vraisemblance de melange
  • Data augmentation pour melange
  • EM pour melange
  • modele d'epidemie
  • voyageur de commerce (fichier townz)
  • Et une illustration du "pourquoi R et pas SAS ?":
  • simulation sous SAS
  • Questions ?