Statistique 2 : description et mesure de la liaison entre deux variables

 
  3 jours       1620       Avancé    
  Prochaine session
17, 18, 19 juin 2024
Objectifs de la formation
  • Réaliser des traitements simples sur des données bidimensionnelles
  • Calculer des indicateurs permettant de mesurer la liaison entre deux variables
  • Discerner la pertinence des outils employés ainsi que leurs limites
Statistique 2 : description et mesure de la liaison entre deux variables
Prérequis

Niveau de statistique correspondant à la formation Statistique 1 et connaissances de base d’Excel.


Public visé

Toute personne souhaitant s’initier à la statistique descriptive bivariée et acquérir un regard critique par rapport à ses résultats.


Programme détaillé

Cette formation est un prolongement de la formation Statistique 1 et permet de réaliser des traitements sur des données bidimensionnelles. La formation a une orientation pratique forte, de nombreux exemples et exercices seront proposés avec Excel.

Cas de deux variables qualitatives

  • Les tableaux de contingence
  • Les distributions marginales et conditionnelles
  • Les représentations graphiques
  • La statistique du khi-deux
  • Le V de Cramer

Cas de deux variables quantitatives

  • La représentation graphique : le nuage de point
  • La covariance
  • Le coefficient de corrélation linéaire
  • L’ajustement linéaire (droite de régression)

Cas de deux variables ordinales

  • Le coefficient de corrélation de rang de Spearman
  • Le coefficient de corrélation de rang de Kendall

Cas des variables discrètes

  • La courbe de régression

Cas d’une variable qualitative et d’une variable quantitative

  • Les représentations graphiques
  • Les moyennes et variances conditionnelles et marginales
  • L’analyse de variance à un facteur
  • Le rapport de corrélation

Atelier : mise en œuvre des notions vues au cours de la formation au travers de différentes études de cas.


Les principaux outils permettant de mesurer la liaison entre deux variables statistiques

 

Mesurer la liaison entre deux variables en statistique est important pour comprendre la relation qui existe entre elles. Cela permet d’explorer si les variations dans une variable sont associées aux variations dans l’autre variable, et dans quelle mesure. Cette mesure de liaison est essentielle pour identifier les dépendances, les corrélations et les tendances entre les variables, ce qui peut fournir des informations précieuses dans de nombreux domaines.

Les outils couramment utilisés pour mesurer la liaison entre deux variables sont :

  • Diagrammes de dispersion : Les diagrammes de dispersion (scatter plots ou nuages de points) sont utilisés pour représenter graphiquement la relation entre deux variables continues. Ils permettent de visualiser la distribution des points de données dans le plan cartésien, ce qui peut aider à détecter des motifs ou des tendances visuelles dans les données.

  • Régression linéaire simple : La corrélation linéaire mesure la force et la direction de la relation linéaire entre deux variables continues. Le coefficient de corrélation linéaire le plus couramment utilisé est le coefficient de corrélation de Pearson, qui varie de -1 à 1. Une corrélation positive indique une relation directe, tandis qu’une corrélation négative indique une relation inverse. Une valeur proche de 0 indique une absence de corrélation linéaire.

  • Coefficient de détermination (R²) : Le coefficient de détermination est utilisé pour mesurer la proportion de la variation d’une variable qui peut être expliquée par une autre variable indépendante dans un modèle de régression. Il indique la force de la relation entre les variables et varie de 0 à 1. Plus la valeur de R² est proche de 1, plus la variable indépendante explique la variation de la variable dépendante.

  • Test d’indépendance : Les tests d’indépendance, tels que le test du chi-carré, sont utilisés pour déterminer si deux variables catégorielles sont indépendantes ou s’il existe une association significative entre elles. Ces tests comparent les fréquences observées dans chaque catégorie avec les fréquences attendues s’il n’y avait aucune association.

  • Analyse de la variance : La décomposition de la variance permet de calculer le rapport de corrélation. Cet indicateur mesure la proportion de la variance qui peut être expliquée par une autre variable pouvant être qualitative. Il varie de 0 à 1 et mesure la force de la corrélation (non forcément linéaire) entre les variables.

En utilisant ces outils, il devient possible de quantifier et d’interpréter la liaison entre deux variables, ce qui contribue à une meilleure compréhension des relations dans les données et à des prises de décision plus informées.