Analyse et traitement des données manquantes

 
  2 jours       1080       Avancé    
  Prochaine session
18 et 19 décembre 2023
Objectifs de la formation
  • Visualiser un dispositif de données manquantes
  • Imputer un tableau incomplet
  • Modéliser avec des données manquantes
  • Mettre en œuvre des méthodes de traitement de données manquantes sous R.

Prérequis

Une pratique de l’analyse des données est souhaitable


Public visé

Data analysts, chargés d’études statistiques, data scientists


Contenu

Typologie, visualisation et fondamentaux du traitement des données manquantes

  • Introduction à la problématique
  • Manipulation des données manquantes avec R et dplyr
  • Typologie des données manquantes (MCAR, MAR, MNAR)
  • Visualisation du dispositif de données manquantes : packages naniar, vim, ggplot, visu avec une ACM
  • Traitement des données manquantes par des méthodes d’imputation simple

Travaux pratiques avec les packages R suivants : mice, missForest et missMDA

Techniques avancées de traitement des données manquantes

  • Imputation de tableaux avec des variables qualitatives ou mixtes
  • Imputation multiple : enjeux, méthodes de génération de tableaux multiple, modélisation
  • Rapide discussion sur des méthodes spécifiques : échantillonnage, données temporelles

Travaux pratiques avec les packages R suivants : mice, Amelia, missForest et missMDA

Approche pédagogique

  Moyens pédagogiques

  • Exposé théorique de concepts
  • Applications pratiques sur ordinateur
  • Etude de cas concrets
  • Échanges sur les pratiques et expériences des participants
  • Temps de questions / réponses
  • Exercices, quiz, forum etc.