Statistique inférentielle : estimation ponctuelle, intervalle de confiance et test statistique

 
  3 jours       1620       Avancé    
  Prochaine session
27, 28, 29 mai 2024
Objectifs de la formation
  • Connaître les bases de la statistique inférentielle
  • Se familiariser avec la notion d’échantillonnage
  • Connaître les principaux estimateurs, intervalles de confiance et tests statistiques sur des proportions, moyennes et variances, pour un ou deux échantillons
  • Savoir mettre en œuvre ces calculs

Prérequis

Maîtrise des formulations mathématiques usuelles, connaissances de base en statistiques descriptives (formation Statistiques descriptives avec R)


Public visé

Data analysts, chargés d’études statistiques


Programme détaillé

La formation présente les principaux concepts de la statistique inférentielle, qui consiste à induire les caractéristiques inconnues d’une population à partir d’un échantillon issu de cette population. Elle insiste sur la mise en œuvre de ces concepts, de nombreux exemples sont traités sur logiciels statistiques.

Cette formation constitue un pilier indispensable pour de nombreuses techniques statistiques, telles que la régression, la régression logistique, l’économétrie, les sondages, etc.

Les applications seront réalisées à partir de R. Les stagiaires pourront également réaliser les exercices en utilisant Python ou SAS.

Notions de probabilités

  • Variable aléatoire
  • Espérance et variance
  • Lois de probabilités usuelles, discrètes et continues : loi binomiale, loi de Poisson, loi normale, loi de Student, loi du Khi-deux, loi de Fisher-Snedecor

Échantillonnage

  • Fluctuations d’échantillonnage
  • Loi des grands nombres
  • Théorème central limite

Estimation ponctuelle et estimation par intervalle de confiance

  • Définition d’un estimateur et critères de qualité (consistance, biais et variance)
  • Estimation d’une proportion, d’une moyenne et d’une variance
  • Définition d’un intervalle de confiance
  • Intervalle de confiance pour une proportion, une moyenne, et une variance
  • Applications sur cas pratiques

Tests statistiques

  • Principe général d’un test : hypothèses nulle et alternative ; erreurs de 1ère et de 2ème espèce ; niveau de test, probabilité critique
  • Tests paramétriques sur une proportion, une moyenne, et une variance
  • Tests de comparaison de deux échantillons (appariés ou non)
  • Tests d’adéquation à une loi : test du khi-deux et test de Kolmogorov-Smirnov
  • Applications sur cas pratiques

De la statistique descriptive à la statistique inférentielle...

 

La statistique inférentielle est une branche de la statistique qui permet de faire des inférences ou des généralisations à partir d’un échantillon de données afin de tirer des conclusions sur une population plus large. Elle diffère de la statistique descriptive qui se concentre sur la description et le résumé des caractéristiques des données observées.

Alors quelles sont les principales différences entre la statistique inférentielle et la statistique descriptive ?

1/ Objectifs

  • Statistique descriptive : L’objectif principal de la statistique descriptive est de résumer et de décrire les caractéristiques des données disponibles, telles que les mesures de tendance centrale, de dispersion, les graphiques, etc. Elle ne cherche pas à généraliser au-delà de l’échantillon observé.

  • Statistique inférentielle : L’objectif principal de la statistique inférentielle est de faire des inférences sur une population plus large à partir d’un échantillon de données. Elle permet de tirer des conclusions, d’estimer des paramètres inconnus et de tester des hypothèses sur la population.

2/ Population et échantillon

  • Statistique descriptive : La statistique descriptive s’applique directement aux données observées, sans nécessairement considérer la population dont elles sont extraites. Elle fournit une description des caractéristiques de l’échantillon.

  • Statistique inférentielle : La statistique inférentielle considère l’échantillon comme une représentation de la population d’intérêt. Les résultats obtenus à partir de l’échantillon sont généralisés à la population plus large.

En deux mots, la statistique descriptive se concentre donc sur la description des caractéristiques des données observées, tandis que la statistique inférentielle vise à faire des inférences et des généralisations sur une population plus large à partir d’un échantillon. La statistique inférentielle permet de tirer des conclusions sur la population en utilisant des méthodes statistiques telles que l’estimation des paramètres, les tests d’hypothèses et la quantification de l’incertitude. C’est l’objet de cette formation.