Analyse et traitement des données manquantes
Prochaine session
18 et 19 décembre 2023
- Visualiser un dispositif de données manquantes
- Imputer un tableau incomplet
- Modéliser avec des données manquantes
- Mettre en œuvre des méthodes de traitement de données manquantes sous R.
Une pratique de l’analyse des données est souhaitable
Data analysts, chargés d’études statistiques, data scientists
Typologie, visualisation et fondamentaux du traitement des données manquantes
- Introduction à la problématique
- Manipulation des données manquantes avec R et dplyr
- Typologie des données manquantes (MCAR, MAR, MNAR)
- Visualisation du dispositif de données manquantes : packages naniar, vim, ggplot, visu avec une ACM
- Traitement des données manquantes par des méthodes d’imputation simple
Travaux pratiques avec les packages R suivants : mice, missForest et missMDA
Techniques avancées de traitement des données manquantes
- Imputation de tableaux avec des variables qualitatives ou mixtes
- Imputation multiple : enjeux, méthodes de génération de tableaux multiple, modélisation
- Rapide discussion sur des méthodes spécifiques : échantillonnage, données temporelles
Travaux pratiques avec les packages R suivants : mice, Amelia, missForest et missMDA
Moyens pédagogiques
- Exposé théorique de concepts
- Applications pratiques sur ordinateur
- Etude de cas concrets
- Échanges sur les pratiques et expériences des participants
- Temps de questions / réponses
- Exercices, quiz, forum etc.
Méthodes pédagogiques