Python expert — Python pour la data science et le machine learning
Prochaine session
19 et 20 avril 2023
- Comprendre les concepts de base de l’apprentissage automatique et de l’analyse de données, tels que les types de modèles, les algorithmes courants et les métriques courantes.
- Maîtriser les bibliothèques Python les plus couramment utilisées pour la data science, telles que Scikit Learn, Pandas, Matplotlib, et Seaborn.
- Être capable de résoudre des problèmes concrets de classification et de régression supervisée en utilisant des algorithmes tels que les arbres de décision, la régression linéaire, les réseaux de neurones, etc.
- Être capable de résoudre des problèmes de clustering non supervisé et de réduction de dimensionnalité en utilisant des algorithmes tels que k-means et PCA.
- Être capable de créer des modèles de machine learning performants pour résoudre des problèmes professionnels et de communiquer les résultats de manière claire et concise.
Parmi nos formations au langage Python, cette formation est le niveau 3. Elle requiert une bonne maîtrise et une utilisation régulière de Python (contenu des formations niveau 1 - Python initiation et niveau 2 - Python intermédiaire).
Voir les 3 modules Python expert
Toute personne souhaitant développer une utilisation avancée de Python dans le domaine de la data science et du machine learning, notamment les data scientists et data analysts déjà utilisateurs de Python
La formation est conçue pour être à la fois théorique et pratique, avec une combinaison de présentations de concepts, de démonstrations et de travaux pratiques pour les participants. Les participants auront l’occasion de mettre en pratique les concepts couverts en utilisant des données réelles et en travaillant sur un problème concret.
Si nécessaire, une section introduction permettra de revoir les bases du langage python pour l’analyse de donnée tels que les variables, les boucles, les fonctions et les structures de données.
Introduction au machine learning et ses principales applications
Méthodologie de data science pour l’apprentissage automatique supervisé
- La définition de la cible et des variables explicatives
- La construction du jeu de données et préparation des données
- Le choix du modèle supervisé de classification ou de régression (Gradient Boosting, Random Forest, Réseaux de neurones, Régressions, etc)
- Le paramétrage et l’entraînement du modèle
- L’évaluation du modèle
Approfondissement de la théorie sur quelques cas d’algorithmes classiques de machine learning
- Vectorisation du problème
- Descente de gradient
Codage d’un algorithme d’apprentissage automatique supervisé from scatch
Le diagnostic d’un modèle, la gestion du sur-apprentissage ou du sous-apprentissage
Cas pratique sur un problème concret issu de Kaggle (par exemple, prédiction des locations de vélos partagés)
- Exploration les données,
- Entraînement de modèles
- Evaluation de modèles,
- Affichage et analyse des résultats.
Initiation à l’apprentissage non-supervisé
Moyens pédagogiques
- Exposé théorique de concepts
- Démonstration
- Expérimentation
- Applications pratiques sur ordinateur
- Etude de cas concrets
- Échanges sur les pratiques et expériences des participants
- Temps de questions / réponses
- Exercices, quiz, forum etc.
Méthodes pédagogiques