Bootstrap et rééchantillonnage

 
  Toutes les formations  Méthodes statistiques
  2 jours       Avancé    
Objectifs

Connaître les méthodes de rééchantillonnage et leurs applications classiques pour l’inférence statistique.


Prérequis

Connaissances de base en statistique inférentielle paramétrique et non-paramétrique : estimation, intervalles de confiance, tests. Notions de régression, discrimination, séries temporelles.


Contenu

Cette formation a pour objectif de dresser un panorama des méthodes de rééchantillonnage et de leurs applications classiques pour l’inférence statistique : estimation du biais, de la variance d’un estimateur, construction d’intervalles de confiance, construction de tests d’hypothèses. Une attention particulière sera portée au bon usage du rééchantillonnage en pratique, en s’appuyant sur des cas typiques d’échec du bootstrap « naïf » : valeurs extrêmes, régression, discrimination, séries temporelles, U statistiques, pour lesquels des remèdes seront proposés. Enfin, les méthodes récentes d’agrégation basées sur le rééchantillonnage (bagging, forêts aléatoires, boosting) seront évoquées.

Méthodes de rééchantillonnage et applications à l’inférence statistique

  • Introduction, principe du plug in
  • Bootstrap et rééchantillonnage : jackknife, bootstrap dit « naïf », bootstrap à poids
  • Propriétés d’un estimateur : estimation bootstrap du biais, de la variance, de l’erreur quadratique moyenne
  • Intervalles de confiance : bootstrap-t, percentile bootstrap, BC-percentile bootstrap, Bca-percentile bootstrap
  • Tests d’hypothèses : tests de permutation, tests bootstrap

Quelques échecs du boostrap naïf et remèdes

  • Valeurs extrêmes
  • Régression
  • Discrimination
  • Séries temporelles
  • U statistiques

Méthodes d’agrégation basées sur le bootstrap

  • Bagging
  • Forêts aléatoires
  • Boosting

Modalités pédagogiques

Afin de mobiliser les participants, de multiplier les échanges et de faciliter l’assimilation des connaissances, cette formation alterne exposés théoriques et applications pratiques / cas concrets / travaux sur ordinateur.