Modélisation et initiation au machine learning

 
  Toutes les formations  Data science
  3 jours       2000       Avancé    
  Prochaine session
3, 4, 5 avril 2018
Objectifs

Comprendre et maîtriser les méthodes de régression à mettre en oeuvre en fonction du type de la variable à expliquer et du nombre de variable.

Connaitre les méthodes de base du machine learning.


Prérequis

Pratique régulière de R et maîtrise de la régression linéaire (formation Régression linéaire et analyse de la variance)


Contenu

Dans ce module, nous nous intéressons à la modélisation d’une variable d’intérêt par plusieurs autres variables. Cette variable d’intérêt peut être quantitative (régression) ou qualitative (discrimination ou classification supervisée). Nous commencerons par dissocier l’approche statistique de l’approche machine learning. Pour ce faire, nous introduirons la notion de risque en régression et en classification supervisée ainsi que diverses techniques permettant d’évaluer ce risque (validation croisée, approche out of bag).

Rappel des méthodes de régression (moindres carrés, régression logistique)

Régression sous contrainte (Ridge ou lasso ou elasticnet)

Rappel des méthodes par arbres (CART)

Présentation des méthodes d’agrégation (bagging et forêts aléatoires)


Modalités pédagogiques

Afin de mobiliser les participants, de multiplier les échanges et de faciliter l’assimilation des connaissances, cette formation alterne exposés théoriques et applications pratiques / cas concrets / travaux sur ordinateur.