Statistique et méthodes de régression pour données spatiales

 
  3 jours       1620       Avancé    
  Prochaine session
12, 13, 14 novembre 2024
Objectifs de la formation
  • Comprendre les enjeux de la prise en compte des effets spatiaux en statistique et en économétrie
  • Mettre en œuvre les méthodes d’estimation adéquates
  • Interpréter les paramètres associés aux variables spatiales

Prérequis

Bonnes connaissances en économétrie (il est indispensable de maîtriser le contenu des formations Économétrie 1 et Économétrie 2)


Public visé

Cette formation est conseillée à celles et ceux qui souhaitent comprendre et utiliser les statistiques spatiales et les méthodes de régression spatiale à la fois sur données quantitatives et qualitatives.


Programme détaillé

L’analyse de données spatiales exige la mise en œuvre d’outils statistiques spécifiques. L’un des plus classiques est la mesure de l’autocorrélation spatiale. Les méthodes de l’économétrie spatiale ont été développées pour tenir compte de cette dépendance spatiale dans les analyses statistiques classiques et éviter que celle-ci n’introduise des biais dans l’estimation des paramètres.

La formation présente les outils de base de la statistique spatiale qui vont compléter et enrichir l’approche strictement cartographique. Elle s’attache ensuite à présenter les manières de formaliser les effets spatiaux (effet de débordement et de dépendance spatiale, hétérogénéité) et les différentes spécifications économétriques spatiales ainsi que leur estimation par différentes méthodes. Les tests de spécifications les plus courants seront également exposés. La formation est illustrée par des exemples issus de la littérature récente dans ce domaine et des applications à partir des logiciels R ou Stata.

Introduction : nécessité de la prise en compte de la dimension spatiale

Introduction à la statistique spatiale

  • La boîte à outils d’analyse des données spatiales
  • Analyse exploratoire des données spatiales et tests
  • Cartographie des indicateurs

L’étude de l’autocorrélation spatiale en économétrie

  • Une typologie des modèles spatiaux
  • Effet multiplicateur et effet de diffusion spatiale
  • Modèle spatialement autorégressif
  • Modèle à erreurs spatialement autocorrélées
  • Modèle de Durbin spatial
  • Les tests de spécification
  • Modèle de dépendance spatiale forte, notamment via les facteurs communs

L’étude de l’hétérogénéité spatiale en économétrie

  • Instabilité des paramètres et inférence statistique
  • La régression géographique pondérée
  • Les modèles à régimes spatiaux
  • Interactions entre autocorrélation et hétérogénéité spatiale
  • Régression spatiale sur données de panel

La statistique pour données spatiales : pourquoi et comment ?

 

La statistique pour données spatiales est une branche de la statistique qui se concentre sur l’analyse des données qui sont géographiquement référencées ou liées à des positions dans l’espace. Elle vise à comprendre la structure, les relations et les modèles spatiaux des données, ainsi qu’à explorer et à expliquer les variations spatiales.

Les données spatiales peuvent provenir de divers domaines, tels que la géographie, l’écologie, l’épidémiologie, l’urbanisme, etc. Elles peuvent inclure des informations géographiques telles que les coordonnées géographiques, les adresses, les polygones ou les grilles spatiales.

Les méthodes utilisées en statistique pour données spatiales incluent notamment :

  • Analyse exploratoire des données spatiales : Cela implique l’utilisation de graphiques, de cartes, de diagrammes de dispersion, de statistiques descriptives et d’autres techniques pour visualiser et résumer les caractéristiques spatiales des données.

  • Autocorrélation spatiale : L’autocorrélation spatiale examine la dépendance spatiale entre les observations. Les mesures d’autocorrélation spatiale, telles que l’indice de Moran et le diagramme en boîte de Moran, permettent de quantifier la similarité spatiale et d’identifier les clusters, les motifs et les processus de diffusion spatiale.

  • Modèles de régression spatiale : Ces modèles prennent en compte la dépendance spatiale et permettent d’analyser comment les variables explicatives influencent une variable réponse, tout en tenant compte de l’autocorrélation spatiale. Les modèles couramment utilisés incluent le modèle de régression spatiale autorégressif (SAR) et le modèle de régression spatiale à pondération spatiale (Spatial lag).

  • Kriging : Le kriging est une méthode d’interpolation utilisée pour estimer les valeurs inconnues dans l’espace à partir de données spatiales observées. Il est couramment utilisé dans le domaine de la géostatistique pour modéliser et prédire les surfaces spatiales.

  • Analyse de cluster spatial : Cette méthode vise à identifier les groupes ou clusters spatiaux similaires. Des techniques telles que le cluster de l’indice de Moran, l’algorithme DBSCAN, le scan spatial et les méthodes de partitionnement spatial peuvent être utilisées pour détecter les clusters spatiaux significatifs.

  • Analyse de point : L’analyse de point se concentre sur la distribution spatiale des points, tels que les événements, les points d’observation ou les sites. Des méthodes telles que la fonction de distribution des points, l’intensité de points, le processus de Poisson, les modèles de cluster et les tests de distance peuvent être utilisées pour analyser les modèles de point.