Les fondamentaux du Machine learning avec R
Prochaine session
20 et 21 avril 2023
- Comprendre les principes du machine learning : régression vs classification supervisée, biais-variance, sur-apprentissage, validation croisée…
- Connaître et savoir mettre en œuvre les méthodes de base en régression et classification supervisée : modèle linéaire généralisé (GLM), régression régularisée
- Appréhender les méthodes d’arbres (CART & random forest) et les mettre en pratique.
- Connaissances de base en statistiques descriptives (formation Statistiques descriptives avec R).
- Connaissances de base en statistique inférentielle (formation Statistique inférentielle : estimation ponctuelle, intervalle de confiance et test statistique).
- Connaissances intermédiaires du logiciel R (formation R intermédiaire).
Data analysts, data scientists
La formation présente les concepts de base en machine learning, ainsi que les méthodes de base en régression et classification supervisée.
Bases du machine learning
- Apprentissage supervisé vs non supervisé
- Régression vs classification supervisée
- Coût (perte) et risque (erreur de généralisation)
- Biais-variance d’un prédicteur
- Sur-apprentissage et palliatifs (apprentissage/test, validation croisée)
Modèle linéaire généralisé - GLM
- Régression : régression linéaire
- Classification supervisée : régression logistique
- Applications sur cas pratiques
Régression régularisée
- Ridge
- LASSO
- Elasticnet
- Applications sur cas pratiques
Méthodes d’arbres
- Arbres de régression et de décision (CART)
- Introduction aux random forests
- Applications sur cas pratiques
Moyens pédagogiques
- Exposé théorique de concepts
- Applications pratiques sur ordinateur
- Échanges sur les pratiques et expériences des participants
- Temps de questions / réponses
- Exercices, quiz, forum etc.
Méthodes pédagogiques