Statistiques descriptives avec Python

Toutes les formations Méthodes statistiques

2 jours 1140 Initiation

Prochaines sessions et informations pratiques

Objectifs de la formation

Comprendre et savoir mettre en œuvre les principaux outils de statistique descriptive d’une variable : tableaux, graphiques, indicateurs (tendance centrale, dispersion, forme, concentration).
Comprendre et savoir mettre en œuvre les principaux outils de statistiques descriptives bivariées : tableaux de contingence, graphiques conditionnels, etc.

Objectifs de la formation

Comprendre et savoir mettre en œuvre les principaux outils de statistique descriptive d’une variable : tableaux, graphiques, indicateurs (tendance centrale, dispersion, forme, concentration).
Comprendre et savoir mettre en œuvre les principaux outils de statistiques descriptives bivariées : tableaux de contingence, graphiques conditionnels, etc.

Prérequis

Connaissances de base en Python (formation Python initiation).

Prérequis

Connaissances de base en Python (formation Python initiation).

Public visé

Data analysts, chargés d’études statistiques

Public visé

Data analysts, chargés d’études statistiques

Programme détaillé

La formation est consacrée à la présentation et la mise en œuvre des principaux outils de statistique descriptive.

Statistiques descriptives pour une variable (6h)

Représentation des distributions statistiques sous forme de tableaux et de graphiques (diagrammes en bâtons, en barres, en secteurs, histogrammes)
Calcul d’indicateurs de position (moyenne, médiane), de dispersion (variance, écart-type) et de forme
Applications sur cas pratiques

Statistiques descriptives pour deux variables (6h)

Tableau de contingence
Calcul d’indicateurs de liaison entre variables : statistique du khi-deux, V de Cramer, coefficient de corrélation linéaire, etc.
Analyses graphiques de la relation entre deux variables : nuages de points, boîtes à moustaches conditionnelles, etc.
Applications sur cas pratiques

Programme détaillé

La formation est consacrée à la présentation et la mise en œuvre des principaux outils de statistique descriptive.

Statistiques descriptives pour une variable (6h)

Représentation des distributions statistiques sous forme de tableaux et de graphiques (diagrammes en bâtons, en barres, en secteurs, histogrammes)
Calcul d’indicateurs de position (moyenne, médiane), de dispersion (variance, écart-type) et de forme
Applications sur cas pratiques

Statistiques descriptives pour deux variables (6h)

Tableau de contingence
Calcul d’indicateurs de liaison entre variables : statistique du khi-deux, V de Cramer, coefficient de corrélation linéaire, etc.
Analyses graphiques de la relation entre deux variables : nuages de points, boîtes à moustaches conditionnelles, etc.
Applications sur cas pratiques

Teaser : les principales bibliothèques Python utilisées en statistique descriptive

Python est un langage de programmation polyvalent et largement utilisé, offrant de nombreux packages et bibliothèques pour effectuer des analyses statistiques et descriptives. Voici les principales bibliothèques de Python pour mener des travaux de statistique descriptive :

Bibliothèque NumPy : NumPy fournit des fonctions pour effectuer des calculs numériques rapides et efficaces. Elle est souvent utilisée pour le calcul des mesures de tendance centrale, de dispersion et d’autres statistiques descriptives.

Exemple de code Python avec NumPy :

import numpy as np

# Calcul de la moyenne
np.mean(data)

# Calcul de l'écart-type
np.std(data)

# Calcul des quartiles
np.percentile(data, [25, 50, 75])

Bibliothèque Pandas : Pandas est une bibliothèque très utilisée pour la manipulation et l’analyse de données. Elle offre des fonctionnalités pour effectuer des statistiques descriptives, comme le calcul des mesures de tendance centrale, de dispersion, la génération de tableaux de fréquences, etc.

Exemple de code Python avec Pandas :

import pandas as pd

# Calcul de la moyenne
data.mean()

# Calcul de l'écart-type
data.std()

# Tableau de fréquences
data.value_counts()

Bibliothèque SciPy : SciPy est une bibliothèque qui propose des fonctions avancées pour les calculs scientifiques et statistiques. Elle inclut des méthodes pour l’analyse des données, le calcul des statistiques descriptives, l’estimation des paramètres, etc.

Exemple de code Python avec SciPy :

import scipy.stats as stats

# Test de normalité
stats.normaltest(data)

# Régression linéaire
slope, intercept, r_value, p_value, std_err = stats.linregress(x, y)

Bibliothèque Matplotlib et Seaborn : Matplotlib et Seaborn sont des bibliothèques de visualisation de données en Python. Elles permettent de créer des graphiques tels que des histogrammes, des diagrammes en boîte, des graphiques en barres, des nuages de points, etc., pour visualiser la distribution et les relations entre les variables.

Exemple de code Python avec Matplotlib :

import matplotlib.pyplot as plt

# Histogramme
plt.hist(data, bins=10)

# Nuage de points
plt.scatter(x, y)

plt.show()

Python dispose d’une vaste gamme d’autres packages et fonctionnalités permettant d’effectuer des analyses descriptives plus avancées en fonction de vos besoins spécifiques. La documentation de chaque bibliothèque et package fournit des informations détaillées sur leur utilisation et vous permettra d’aller plus loin.

Teaser : les principales bibliothèques Python utilisées en statistique descriptive

Exemple de code Python avec NumPy :

import numpy as np

# Calcul de la moyenne
np.mean(data)

# Calcul de l'écart-type
np.std(data)

# Calcul des quartiles
np.percentile(data, [25, 50, 75])

Exemple de code Python avec Pandas :

import pandas as pd

# Calcul de la moyenne
data.mean()

# Calcul de l'écart-type
data.std()

# Tableau de fréquences
data.value_counts()

Exemple de code Python avec SciPy :

import scipy.stats as stats

# Test de normalité
stats.normaltest(data)

# Régression linéaire
slope, intercept, r_value, p_value, std_err = stats.linregress(x, y)

Exemple de code Python avec Matplotlib :

import matplotlib.pyplot as plt

# Histogramme
plt.hist(data, bins=10)

# Nuage de points
plt.scatter(x, y)

plt.show()

Approche pédagogique

Moyens pédagogiques

Exposé théorique de concepts
Applications pratiques sur ordinateur
Échanges sur les pratiques et expériences des participants
Temps de questions / réponses
Exercices, quiz, forum etc.

Méthodes pédagogiques

Méthode expositive
Méthode active

Mode de financement	En quoi consiste-t-il ?	A qui s'adresse-t-il ?	Pour quel type de formation ?
Le Plan de développement des compétences	Le plan de développement des compétences rassemble l’ensemble des actions de formation définies dans le cadre de la politique de de gestion des ressources humaines de votre entreprise. Le PDC vous permet de suivre des actions de formation à l’initiative de votre employeur. Il comprend alors un maintien de la rémunération professionnelle, un coût de formation à la charge de l’entreprise et un temps de formation sur le temps de travail. Pour davantage d’information sur les possibilités de prise en charge, adressez-vous à votre service des ressources humaines.	Aux salariés	Pour toutes les formations
Le Compte Personnel de Formation (CPF) Anciennement Droit individuel à la formation (DIF)	Le CPF a été créé pour vous permettre de disposer d’un crédit formation (en euros depuis le 1er janvier 2019) afin de vous former tout au long de votre vie et d’ainsi augmenter votre employabilité. Votre CPF est également utilisable en période de chômage. Nos formations certifiantes sont reconnues d’Etat et inscrites au Répertoire Spécifique (RS). Elles sont référencées sur Mon Compte Formation et finançables par le CPF. Depuis septembre 2020, les entreprises peuvent abonder directement le compte CPF des salariés. L’employeur peut ainsi financer le reste à charge du projet de formation de son salarié. Depuis le 20 février 2026, la loi de finances pour 2026 (décret n° 2026-127()) a modifié les modalités selon lesquelles les titulaires peuvent mobiliser leurs droits sur Mon Compte Formation. Vous pouvez mobiliser désormais au maximum 1 500 € de vos droits CPF* pour suivre une formation qui prépare à une certification professionnelle inscrite au RS. Ici, ni convention ou contrat de formation ne sont signés, ce sont les Conditions Générales d’Utilisation (CGU) du CPF qui s’appliquent. (*) « Art. D. 6323-1 A. - Le plafond de droits mobilisables, inscrits sur le compte personnel de formation en application des articles L. 6323-11, L. 6323-27 et L. 6323-34 est fixé à : « Mille cinq cents euros pour les actions sanctionnées par des certifications et habilitations enregistrées dans le répertoire spécifique mentionné à l'article L. 6113-6 ». Plus d'informations sur service-public.fr	Aux salariés et aux demandeurs d'emploi	Pour les formations certifiantes
Reconversion ou promotion par alternance (Pro-A, ex-Période de Professionnalisation)	La Reconversion ou promotion par alternance a pour objectif de favoriser l’évolution professionnelle et le maintien dans l’emploi des salariés. Elle prend la forme d’un parcours de formation personnalisé alternant enseignements et activité professionnelle. Plus d'informations sur service-public.fr	Aux salariés	Pour les formations certifiantes
L’Aide Individuelle à la Formation (AIF)	L’AIF contribue au financement des frais pédagogiques de votre formation lorsque les dispositifs de financements existants (collectivités territoriales, OPCO...) ne peuvent prendre en charge partiellement ou entièrement votre projet formation. Votre conseiller France Travail validera votre projet au regard du contenu et de la durée de la formation, de son coût, mais aussi de son efficacité pour votre retour à l’emploi. Plus d'informations sur france-travail.fr	Aux demandeurs d'emploi	Pour toutes les formations
Le Conseil Régional ou le Conseil Départemental	La plupart des collectivités territoriales mettent en place des dispositifs d’aide à la formation professionnelle pour une première recherche d’emploi ou une reconversion professionnelle. Chaque région / département définit sa propre politique en termes de financement des formations. Renseignez-vous auprès du Conseil dont vous dépendez.		Pour toutes les formations
FINANCEMENT DES ACTIONS DE RECLASSEMENT PAR L’EMPLOYEUR	Dans le cadre d’un licenciement économique dans une entreprise de plus de 1000 salariés, le congé de reclassement permet au salarié de se former pendant la durée de son accompagnement. Le financement de la formation dans le cas d’un congé de reclassement est financé par l’employeur et l’OPCO auquel l’entreprise est rattachée. Plus d'informations sur service-public.fr	Aux salariés en congé de reclassement	Pour toutes les formations
FINANCEMENT DE LA CPAM ET DE L’AGEFIPH	Les victimes d’accidents du travail et de maladies professionnelles peuvent bénéficier de l’aide de la CPAM (Caisse primaire d’assurance maladie) qui propose un abondement du CPF. Pour les travailleurs handicapés, l’organisme AGEFIPH (Association de gestion de fonds pour l’insertion professionnelle des handicapés) peut créditer une somme complémentaire sur le CPF.	Aux personnes porteuses d’un handicap	Pour les formations certifiantes