Python intermédiaire

 
  2 jours       860       Avancé    
  Prochaine session
24 et 25 juin 2024
Objectifs de la formation
  • Acquérir les outils et techniques permettant d’effectuer des traitements sur les données, plus rapidement et plus efficacement
  • Connaître les principaux packages d’analyse statistique

Prérequis

Parmi nos formations au langage Python, cette formation est le niveau 2. Elle requiert une connaissance préalable de Python (maîtrise du contenu de la formation niveau 1 - Python initiation).

Un débutant ou un ancien utilisateur ayant peu de pratique s’orientera donc vers la formation Python Initiation. Si au contraire vous êtes déjà un utilisateur avancé de Python, vous serez peut-être intéressé(e) par nos formations Python Expert.


Public visé

Toute personne souhaitant se perfectionner en Python, notamment : statisticiens, chargés d’études, data analysts, data scientists…


Programme détaillé

Cette formation s’adresse à des stagiaires ayant déjà manipulé des données avec le langage Python, désireux d’approfondir leurs connaissances sur ses fonctionnalités.

Chaque chapitre de cette formation permettra aux participants de manipuler les librairies Python sur des cas concrets à partir de travaux pratiques.

Introduction

  • Principales caractéristiques du langage Python
  • Présentation des objets Python de base

Pandas avancé

  • Opérations d’agrégation et de filtrage sur un dataframe Pandas
  • Traitement des données manquantes
  • Recodage de variables
  • Tables multiples : concaténation, jointure
  • crosstab()
  • Itération d’un DataFrame
  • Famille apply et vectorisation : comment appliquer des transformations sur un dataframe ou une serie avec la méthode apply ?
  • datetime : comment manipuler les dates et les heures avec le module datetime ?
  • Techniques d’optimisation avec Pandas

JSON et API

  • Gestion des formats de données JSON
  • Accès à des données en ligne via une API web

Data visualisation avec matplotlib et seaborn


Que vous apportera cette formation ?

 

L’objectif de la formation est de progresser en Python et d’aborder certains aspects plus avancés, en mettant l’accent sur le package Pandas, la gestion des formats de données JSON, l’accès aux données via une API web, et la visualisation des données avec Matplotlib et Seaborn :

Utilisation avancée de Pandas : Pandas est une bibliothèque Python populaire et puissante pour la manipulation et l’analyse de données. Voici quelques fonctionnalités avancées de Pandas :

  • Manipulation de données : Pandas offre des fonctionnalités avancées pour la manipulation de données, telles que le regroupement de données, le tri, la fusion et la jointure de données, ainsi que la gestion des valeurs manquantes.

  • Opérations de transformation : Pandas permet d’effectuer facilement des opérations de transformation sur les données, telles que le filtrage, le remplacement de valeurs, l’ajout de nouvelles colonnes calculées, la normalisation et la discrétisation.

  • Manipulation des séries temporelles : Pandas fournit des fonctionnalités puissantes pour la manipulation et l’analyse des données temporelles, telles que le redimensionnement temporel, l’alignement, la résampling, et le calcul des statistiques temporelles.

  • Fonctions d’agrégation : Pandas propose des fonctions d’agrégation flexibles qui permettent de calculer des statistiques descriptives, des résumés et des agrégations personnalisées sur les données.

Gestion des formats de données JSON : Python offre une prise en charge native pour le format de données JSON. Vous pouvez lire, écrire et manipuler des données JSON en utilisant le module json intégré de Python. La bibliothèque Pandas offre également des fonctionnalités pour charger des données JSON directement dans des structures de données de type DataFrame, ce qui facilite la manipulation et l’analyse de ces données.

Accès à des données via une API web : Python facilite l’accès à des données à partir de services web via des API (Application Programming Interfaces). Vous pouvez utiliser des bibliothèques telles que requests pour effectuer des requêtes HTTP et récupérer des données depuis des API. Une fois les données récupérées, vous pouvez les analyser, les transformer et les intégrer dans vos analyses à l’aide de Pandas ou d’autres bibliothèques.

Visualisation des données avec Matplotlib et Seaborn : Matplotlib est une bibliothèque de visualisation de données très populaire en Python. Elle offre une grande flexibilité pour créer des graphiques statiques et interactifs, tels que des graphiques linéaires, des diagrammes à barres, des diagrammes circulaires, des diagrammes de dispersion, des histogrammes, etc. Seaborn est une autre bibliothèque de visualisation qui s’appuie sur Matplotlib et offre une interface de haut niveau pour créer des graphiques statistiques attrayants et informatifs. Avec Matplotlib et Seaborn, vous pouvez personnaliser les graphiques en ajustant les couleurs, les axes, les légendes, les titres, les annotations, etc. Ces bibliothèques offrent également des fonctionnalités pour créer des visualisations complexes, telles que des cartes, des graphiques en boîte et des matrices de corrélation.