Régression linéaire et analyse de la variance avec SAS NEW

 
  3 jours       1620       Avancé    
Formation langage SAS
Objectifs de la formation
  • Comprendre et savoir mettre en œuvre un modèle de régression linéaire.
  • Savoir mesurer la qualité et la performance d’un modèle de régression.
  • Comprendre et savoir mener une analyse de la variance à un ou deux facteurs.

Prérequis

Public visé

Data analysts, chargés d’études statistiques


Programme détaillé

La formation traite de modèles entrant dans le cadre du modèle linéaire général (GLM), pour modéliser des phénomènes quantitatifs.

Régression linéaire simple

  • Point de vue descriptif : méthode des moindres carrés (MCO)
  • Point de vue inférentiel : validation et qualité du modèle
  • Généralisation du modèle en prévision
  • Applications sur cas pratiques

Régression linéaire multiple

  • Estimation et validation du modèle
  • Sélection de modèles : sélections backward, forward ou stepwise à l’aide des critères AIC, BIC ou Cp de Mallows
  • Traitements des variables explicatives qualitatives
  • Evaluation de la qualité prédictive d’un modèle
  • Applications sur cas pratiques

Analyse de la variance à un facteur

  • Le modèle à effets fixes, tests de comparaisons multiples, analyse de la variance non paramétrique
  • Applications sur cas pratiques

Analyse de la variance à deux facteurs et plus

  • La notion d’interactions
  • Utilisation de variables quantitatives et qualitatives dans le cadre du modèle linéaire général (analyse de la covariance)
  • Applications sur cas pratiques

Teaser : principales procédures SAS pour réaliser régressions linéaires et analyses de variance

 

SAS propose plusieurs procédures pour réaliser à la fois des régressions linéaires et des analyses de la variance (ANOVA). Voici quelques-unes des procédures SAS les plus couramment utilisées :


PROC REG : Cette procédure est utilisée pour effectuer des régressions linéaires simples et multiples. Elle permet également d’effectuer des analyses de variance en utilisant des variables catégorielles comme facteurs dans le modèle. Elle fournit des résultats de régression ainsi que des statistiques descriptives et des diagnostics.

Exemple d’utilisation pour une régression linéaire :

proc reg data=dataset;
  model dependent_var = independent_var;
run;

Exemple d’utilisation pour une analyse de la variance avec un facteur catégoriel :

proc reg data=dataset;
  class categorical_var;
  model dependent_var = categorical_var;
run;


PROC ANOVA : Cette procédure est utilisée pour effectuer des analyses de la variance à un facteur ou à plusieurs facteurs. Elle permet d’effectuer des ANOVA à effets fixes ou à effets mixtes, avec des modèles équilibrés ou déséquilibrés. Elle fournit des résultats tels que les sommes de carrés, les moyennes, les tests F et les comparaisons de moyennes.

Exemple d’utilisation pour une ANOVA à un facteur :

proc anova data=dataset;
  class factor_var;
  model dependent_var = factor_var;
  means factor_var / hovtest;
run;


PROC GLM : Cette procédure est utilisée pour réaliser des modèles linéaires généraux, y compris les régressions linéaires et les ANOVA. Elle permet de spécifier des modèles avec des facteurs catégoriels, des covariables continues et des interactions entre les variables. Elle fournit des résultats de régression ainsi que des analyses de variance et des comparaisons de moyennes.

Exemple d’utilisation pour une régression linéaire :

proc glm data=dataset;
  model dependent_var = independent_var;
run;

Exemple d’utilisation pour une analyse de la variance avec un facteur catégoriel :

proc glm data=dataset;
  class categorical_var;
  model dependent_var = categorical_var;
  means categorical_var / hovtest;
run;


PROC MIXED : Cette procédure est utilisée pour ajuster des modèles linéaires mixtes, qui incluent à la fois des effets fixes et des effets aléatoires. Elle peut également être utilisée pour effectuer des régressions linéaires et des ANOVA à effets mixtes, en tenant compte de la structure de corrélation ou d’hétérogénéité entre les observations. Elle fournit des estimations des effets fixes et des effets aléatoires, ainsi que des tests d’hypothèses associés.

Exemple d’utilisation pour une régression linéaire :

proc mixed data=dataset;
  model dependent_var = independent_var / solution;
run;

Exemple d’utilisation pour une analyse de la variance avec un facteur catégoriel :

proc mixed data=dataset;
  class categorical_var;
  model dependent_var = categorical_var / solution;
run;


L’ensemble de ces procédures offrent des fonctionnalités étendues pour les régressions linéaires et les analyses de la variance. La sélection de la procédure dépendra bien sûr des spécificités de l’analyse que vous souhaitez réaliser. L’objectif de cette formation est aussi de vous aider à choisir les méthodes les plus adaptées au problèmes que vous souhaitez résoudre.