Responsables de services études / marketing / risque / fraude souhaitant se former ou se perfectionner dans quelques unes des méthodes avancées de data mining issues de l’apprentissage statistique.
Managers commanditant des études de marketing quantitatif, et souhaitant mener leurs équipes vers des méthodes statistiques émergeantes .
Notions statistiques de base, méthodes de discrimination usuelles (régression logistique, arbres de décision), régression linéaire.
L’objectif de cette formation est de décrire les principales méthodes de data mining issues de la recherche actuelle en apprentissage statistique, d’en cibler les difficultés et les avantages, d’en évaluer les performances. Des applications sur des jeux de données simulées et réelles seront mises en oeuvre à l’aide du logiciel gratuit R et de SAS Enterprise Miner.
Statistique, apprentissage et data mining
Définitions, positionnement
Principales applications
Panorama des méthodes et de l'offre logicielle
Choix d’une méthode et ajustement des paramètres
Méthodes à noyaux, SVM et SVR
Support Vector Machines pour la discrimination binaire ou multi-classes
Support Vector Regression pour la régression
Ajustement des paramètres
Méthodes d’agrégation et bootstrap
Agrégation de règles de prédiction : intérêt
Principe du bootstrap
Méthodes de boosting (Adaboost et logitboost)
Méthodes de bagging, forêts aléatoires