Techniques de scoring

 
  3 jours       2110       Avancé    
Objectifs de la formation

Savoir construire un score pour la prédiction d’un phénomène binaire, depuis la phase d’échantillonnage jusqu’aux restitutions finales.


Prérequis

Connaissances de base en calcul des probabilités et en statistique (test, régression linéaire).


Public visé

Data Scientists, chargés d’études statistiques, managers d’équipes utilisant des scores (risque bancaire, assurance, marketing, etc.)


Programme détaillé

La formation propose un panorama des méthodes statistiques utilisées pour la production de scores – méthodes classiques de la statistique (analyse discriminante, régression logistique) et méthodes plus “informatiques” (arbres de décision, réseaux de neurones). De nombreux exemples issus de différents secteurs d’activité illustreront ces méthodes. Le but est de présenter les techniques et les pièges de l’étude de données volumineuses, avec un objectif d’aide à la décision. Cette formation ne recourt que peu au formalisme mathématique. Les formations Classification supervisée : analyse discriminante, régression logistique et arbres et Méthodes de régression pour données qualitatives permettront aux statisticiens d’approfondir la théorie et la mise en œuvre des méthodes prédictives classiques. La formation Machine Learning permettra d’approfondir la théorie et la mise en œuvre des méthodes prédictives avancées.

Présentation des techniques de scoring

  • Principales applications
  • Panorama des techniques prédictives et descriptives employées
  • Cycle d’un projet de scoring

Analyse descriptive

  • Graphiques utiles
  • Caractérisation par des tests statistiques
  • Sélection de variables par des tests
  • Gestion des données manquantes

Arbres de décision

  • Construction d’un arbre
  • Trois algorithmes : CHAID, CART, C4.5 – différences et similitudes
  • Exploration statistique avec des arbres
  • Modélisation avec des arbres
  • Extension : forêts aléatoires
  • Forces et faiblesses

Analyse discriminante

  • Principe de l’analyse discriminante linéaire
  • Méthode DISQUAL et fonction de score
  • Forces et faiblesses

Régression logistique

  • Principe de la régression logistique binaire
  • Commentaire d’un modèle
  • Forces et faiblesses
  • Réseaux de neurones
  • Architecture et logique
  • Construction d’un modèle, paramétrage
  • Forces et faiblesses

Comparaison des méthodes de scoring

  • Évaluer la qualité d’un modèle : courbe ROC, courbe de lift
  • Mise en oeuvre : transformer une probabilité en décision
  • Performance et robustesse : l’importance du jeu de test

Le scoring : à quoi ça sert ?

 

En statistique, les techniques de scoring ont pour objectif de prédire ou d’évaluer un résultat ou un comportement spécifique pour une entité individuelle (par exemple, un individu, un client, un prêt, etc.). Ces techniques sont couramment utilisées dans de nombreux domaines tels que la finance, le marketing, l’assurance et la santé pour prendre des décisions basées sur des prédictions et des évaluations quantitatives.

Voici quelques-uns des objectifs courants des techniques de scoring:

  • Prédiction de risque : Les techniques de scoring peuvent être utilisées pour prédire le risque associé à un individu ou à une entité. Par exemple, dans le domaine du crédit, elles permettent de prédire la probabilité de défaut de remboursement d’un emprunteur. Dans le domaine de l’assurance, elles peuvent être utilisées pour prédire la probabilité de réclamation d’un assuré. Ces prédictions de risque aident les institutions financières et les compagnies d’assurance à prendre des décisions éclairées sur l’octroi de crédit ou la tarification des polices d’assurance.

  • Scoring de comportement : Les techniques de scoring peuvent également être utilisées pour évaluer le comportement ou les performances d’une entité. Par exemple, dans le domaine du marketing, elles peuvent être utilisées pour évaluer la propension d’un client à répondre à une offre ou à effectuer un achat. Dans le domaine de la santé, elles peuvent être utilisées pour évaluer la probabilité de rechute d’un patient. Ces évaluations de comportement aident les entreprises à personnaliser leurs offres, à cibler leurs ressources et à optimiser leurs résultats.

  • Segmentation : Les techniques de scoring peuvent être utilisées pour segmenter une population en groupes homogènes en fonction de certaines caractéristiques ou comportements communs. Par exemple, dans le domaine du marketing, elles peuvent être utilisées pour segmenter les clients en groupes ayant des préférences similaires. Dans le domaine de la santé, elles peuvent être utilisées pour segmenter les patients en groupes présentant des risques similaires. Ces segmentations aident les entreprises à mieux comprendre leurs clients ou leurs patients, à adapter leurs stratégies et à personnaliser leurs interactions.

  • Priorisation : Les techniques de scoring peuvent être utilisées pour prioriser les actions ou les ressources en fonction de leur impact attendu. Par exemple, dans le domaine des ventes, elles peuvent être utilisées pour prioriser les prospects en fonction de leur probabilité d’achat. Dans le domaine de la maintenance, elles peuvent être utilisées pour prioriser les interventions en fonction du risque de défaillance d’un équipement. Cette priorisation aide les organisations à allouer efficacement leurs ressources limitées.