Python expert — Python pour la data science et le machine learning

 
  2 jours       1530       Expert    
  Prochaine session
19 et 20 avril 2023
Objectifs de la formation
  • Comprendre les concepts de base de l’apprentissage automatique et de l’analyse de données, tels que les types de modèles, les algorithmes courants et les métriques courantes.
  • Maîtriser les bibliothèques Python les plus couramment utilisées pour la data science, telles que Scikit Learn, Pandas, Matplotlib, et Seaborn.
  • Être capable de résoudre des problèmes concrets de classification et de régression supervisée en utilisant des algorithmes tels que les arbres de décision, la régression linéaire, les réseaux de neurones, etc.
  • Être capable de résoudre des problèmes de clustering non supervisé et de réduction de dimensionnalité en utilisant des algorithmes tels que k-means et PCA.
  • Être capable de créer des modèles de machine learning performants pour résoudre des problèmes professionnels et de communiquer les résultats de manière claire et concise.

Prérequis

Parmi nos formations au langage Python, cette formation est le niveau 3. Elle requiert une bonne maîtrise et une utilisation régulière de Python (contenu des formations niveau 1 - Python initiation et niveau 2 - Python intermédiaire).

En vous inscrivant aux deux autres modules Python expert (Python pour le text mining et Développement d’interfaces graphiques et dataviz avancé), bénéficiez d’un tarif réduit sur le prix total des 3 modules : 4200 € au lieu de 4590 €, pour 6 jours de formation.

Voir les 3 modules Python expert


Public visé

Toute personne souhaitant développer une utilisation avancée de Python dans le domaine de la data science et du machine learning, notamment les data scientists et data analysts déjà utilisateurs de Python


Contenu

La formation est conçue pour être à la fois théorique et pratique, avec une combinaison de présentations de concepts, de démonstrations et de travaux pratiques pour les participants. Les participants auront l’occasion de mettre en pratique les concepts couverts en utilisant des données réelles et en travaillant sur un problème concret.

Si nécessaire, une section introduction permettra de revoir les bases du langage python pour l’analyse de donnée tels que les variables, les boucles, les fonctions et les structures de données.

Introduction au machine learning et ses principales applications

Méthodologie de data science pour l’apprentissage automatique supervisé

  • La définition de la cible et des variables explicatives
  • La construction du jeu de données et préparation des données
  • Le choix du modèle supervisé de classification ou de régression (Gradient Boosting, Random Forest, Réseaux de neurones, Régressions, etc)
  • Le paramétrage et l’entraînement du modèle
  • L’évaluation du modèle

Approfondissement de la théorie sur quelques cas d’algorithmes classiques de machine learning

  • Vectorisation du problème
  • Descente de gradient

Codage d’un algorithme d’apprentissage automatique supervisé from scatch

Le diagnostic d’un modèle, la gestion du sur-apprentissage ou du sous-apprentissage

Cas pratique sur un problème concret issu de Kaggle (par exemple, prédiction des locations de vélos partagés)

  • Exploration les données,
  • Entraînement de modèles
  • Evaluation de modèles,
  • Affichage et analyse des résultats.

Initiation à l’apprentissage non-supervisé

Approche pédagogique

  Moyens pédagogiques

  • Exposé théorique de concepts
  • Démonstration
  • Expérimentation
  • Applications pratiques sur ordinateur
  • Etude de cas concrets
  • Échanges sur les pratiques et expériences des participants
  • Temps de questions / réponses
  • Exercices, quiz, forum etc.