Classification supervisée : analyse discriminante et régression logistique avec SAS
- Connaître l’ensemble des méthodes de référence permettant de répondre au problème de discrimination (également appelé classification supervisée) : analyse discriminante, régression logistique.
- Être capable de définir et de calculer des critères permettant de comparer les performances de modèles.
- Savoir mettre en œuvre les principales méthodes de classification supervisée.
- Connaissances de base en statistiques descriptives (formation Statistiques descriptives avec SAS).
- Connaissances de base en statistique inférentielle (formation Statistique inférentielle : estimation ponctuelle, intervalle de confiance et test statistique).
- Connaissances de base du logiciel SAS (formation SAS initiation).
Data analysts, chargés d’études statistiques, data scientists
La formation traite de modèles adaptés à la prévision de phénomènes qualitatifs en fonction de variables quantitatives et qualitatives.
Présentation du problème de la classification supervisée
- Cadre statistique
- Critères de performance
- Approche scoring
Analyse discriminante linéaire
- Approche descriptive
- Approche prédictive
- Analyse discriminante quadratique
- Applications sur cas pratiques
Régression logistique
- Présentation du modèle
- Estimation des paramètres et tests
- Sélection de modèle
- Introduction aux méthodes pénalisées (ridge et lasso)
- Applications sur cas pratiques
Moyens pédagogiques
- Exposé théorique de concepts
- Applications pratiques sur ordinateur
- Échanges sur les pratiques et expériences des participants
- Temps de questions / réponses
- Exercices, quiz, forum etc.
Méthodes pédagogiques