Statistiques descriptives avec SAS NEW

 
  2 jours       1080       Initiation    
Formation langage SAS
Objectifs de la formation
  • Comprendre et savoir mettre en œuvre les principaux outils de statistique descriptive d’une variable : tableaux, graphiques, indicateurs (tendance centrale, dispersion, forme, concentration).
  • Comprendre et savoir mettre en œuvre les principaux outils de statistiques descriptives bivariées : tableaux de contingence, graphiques conditionnels, etc.

Prérequis

Connaissances de base du logiciel SAS (formation SAS initiation).


Public visé

Data analysts, chargés d’études statistiques


Programme détaillé

La formation est consacrée à la présentation et la mise en oeuvre des principaux outils de statistique descriptive.

Statistiques descriptives pour une variable

  • Représentation des distributions statistiques sous forme de tableaux et de graphiques (diagrammes en bâtons, en barres, en secteurs, histogrammes)
  • Calcul d’indicateurs de position (moyenne, médiane), de dispersion (variance, écart-type) et de forme
  • Applications sur cas pratiques

Statistiques descriptives pour deux variables

  • Tableau de contingence
  • Calcul d’indicateurs de liaison entre variables : statistique du khi-deux, V de Cramer, coefficient de corrélation linéaire, etc.
  • Analyses graphiques de la relation entre deux variables : nuages de points, boîtes à moustaches conditionnelles, etc.
  • Applications sur cas pratiques

Teaser : les principales procédures SAS utilisées en statistique descriptive

 

SAS est idéal pour effectuer des analyses de données et des statistiques. Voici quelques-uns des principaux outils et méthodes de SAS pour la statistique descriptive :


Procédure MEANS : La procédure MEANS est utilisée pour calculer diverses mesures de tendance centrale et de dispersion, telles que la moyenne, la médiane, l’écart-type, l’écart interquartile, les valeurs minimales et maximales, etc. Elle permet de résumer rapidement les caractéristiques d’une variable.

Exemple de code SAS pour la procédure MEANS :

PROC MEANS DATA=dataset;
  VAR variable;
  OUTPUT OUT=summary_stats MEAN=mean MEDIAN=median STD=std MIN=min MAX=max;
RUN;


Procédure FREQ : La procédure FREQ est utilisée pour obtenir des statistiques descriptives pour les variables catégorielles, telles que les fréquences, les pourcentages et les tableaux croisés.

Exemple de code SAS pour la procédure FREQ :

PROC FREQ DATA=dataset;
  TABLES variable;
RUN;


Procédure UNIVARIATE : La procédure UNIVARIATE permet de réaliser une analyse univariée approfondie, y compris la génération de statistiques descriptives, l’exploration de la distribution des données, la détection des valeurs aberrantes et le tracé des diagrammes de distribution.

Exemple de code SAS pour la procédure UNIVARIATE :

PROC UNIVARIATE DATA=dataset;
  VAR variable;
  HISTOGRAM / NORMAL;
  QQPLOT / NORMAL;
RUN;


Procédure TABULATE : La procédure TABULATE est utilisée pour générer des tableaux personnalisés avec des statistiques descriptives croisées entre plusieurs variables.

Exemple de code SAS pour la procédure TABULATE :

PROC TABULATE DATA=dataset;
  CLASS variable1 variable2;
  TABLES variable1, variable2*MEAN;
RUN;


Procédure REPORT : La procédure REPORT permet de créer des rapports personnalisés incluant des statistiques descriptives, des tableaux croisés et des graphiques.

Exemple de code SAS pour la procédure REPORT :

PROC REPORT DATA=dataset;
  COLUMN variable1 variable2 variable3;
  DEFINE variable1 / DISPLAY 'Variable 1';
  DEFINE variable2 / DISPLAY 'Variable 2';
  DEFINE variable3 / DISPLAY 'Variable 3';
RUN;


Mais il existe de nombreuses autres procédures et options disponibles dans SAS, en fonction des besoins spécifiques de votre analyse. Une documentation détaillée est là pour vous aider.