Statistique bayésienne

 
  3 jours       1620       Expert    
Objectifs de la formation
  • Comprendre la construction de modèle par assemblage hiérarchique de modules conditionnellement liés sous l’approche bayésienne.
  • Réaliser une inférence bayésienne, notamment par des méthodes de simulation de type Monte Carlo, et si besoin par des algorithmes Monte Carlo par chaînes de Markov. En faire le scientific reporting.
  • Présenter l’articulation entre la théorie de la décision statistique et l’analyse bayésienne des données.
  • Donner un point de vue critique de l’approche classique des statistiques qui focalise sur la situation d’information parfaite.

Prérequis

Bonne connaissance du formalisme des probabilités et de l’inférence statistique (formation De l’échantillon à la population, estimation et tests). Connaissance du logiciel R (formation R Initiation).


Public visé

Le cours cherche à dégager les éléments clés de la statistique bayésienne, en faisant l’hypothèse que le lecteur possède les bases de la théorie des probabilités et s’est déjà trouvé confronté à des problèmes ordinaires d’analyse statistique classique. Il s’adresse aux utilisateurs de traitements de données désireux de s’assurer de la pertinence des méthodes qu’ils emploient.

Le débutant, au prix d’un investissement intellectuel acceptable, aussi bien que le spécialiste, pourront y trouver les informations fondamentales pour comprendre et mettre en oeuvre des modèles répondant à leurs besoins spécifiques.


Contenu

L’approche bayésienne de la statistique connaît à l’heure actuelle un essor considérable notamment grâce aux progrès de l’informatique et des méthodes numériques de type MCMC. Lorsque l’on réalise une étude en data science, on a souvent des informations a priori provenant soit d’études antérieures soit d’avis d’expert.

La statistique bayésienne permet d’utiliser ces connaissances a priori et de les combiner avec l’information apportée par les données pour obtenir une information a posteriori. La statistique bayésienne est également très utilisée dans les meta-analyses, c’est à dire les analyses qui mettent ensemble plusieurs études réalisées dans des conditions parfois différentes pour en extraire de l’information avec une meilleure précision. Au cours de la formation nous nous efforcerons de comparer les avantages et les inconvénients de l’approche bayésienne par rapport à l’approche classique (ou fréquentiste).

Une probabilité à interpréter comme un pari personnel et conditionnel

  • Modèle statistique à une inconnue. Rappels de lois de probabilité utiles
  • La formule du révérend Thomas Bayes : un processeur d’assimilation de l’information pour une mise à jour séquentielle de la connaissance
  • La formule de Tom Bayes et le langage du Bayésien: intérêt théorique et limites pratiques.
  • Etablir la connaissance initiale : le problème de la loi a priori. Que faire lorsqu’on ne dispose pas d’un expert?
  • Un miracle mathématique : la conjugaison. Que faire lorsqu’il n’a pas lieu?
  • Loi prédictive : la seconde formule de Bayes
  • Théorie de la décision en situation d’information imparfaite

Exemples d’application : performances binomiales les joueurs de baseball de Stein / contrôle de la qualité par attribut.

Le succès des méthodes computationnelles pour évaluer la loi a posteriori

  • Un algorithme ? Chaînes de Markov!
  • Eviter une intégrale incalculable: les méthodes Monte Carlo et Monte-Carlo par chaînes de Markov
  • Les graphes acycliques orientés et le langage BUGS.
  • Mise en oeuvre du moteur d’inférence Jags sous R.
  • Un jeu de Lego pour la modélisation hiérarchique.
  • Modèle à plusieurs inconnues. Retrouver et étendre les modèles classiques.

Exemples d’application : performances binomiales les joueurs de baseball de Stein / la loi de Poisson pour la prévision des résultats d’un tournoi de football.

Aller plus loin grâce à la vision conditionnelle du paradigme bayésien

  • Vérification et validation de modèles
  • Facteur de Bayes et Comparaison de modèles
  • Le prior pour aider à la sélection de variables pertinentes
  • Typologie des sources d’incertitudes et constructions hiérarchiques non standard
  • Mise en oeuvre du moteur d’inférence STAN sous R.
  • Questions de modélisation des participants issues de leur champ d’intérêt professionnel

Exemples d’application : méta-analyse avancée pour le comparaisons de traitement médicaux / modèle dynamique de biomasse et analyse prédictive des stratégies de gestion de la ressource.

Approche pédagogique

  Moyens pédagogiques

  • Exposé théorique de concepts
  • Applications pratiques sur ordinateur
  • Etude de cas concrets
  • Échanges sur les pratiques et expériences des participants
  • Suivi pédagogique individualisé
  • Temps de questions / réponses

  Méthodes pédagogiques