Pipeline de Machine Learning via Tidymodels en R NEW

 
  1 jour       765       Avancé    
  Prochaine session
28 juin 2024
Formation langage R
Objectifs de la formation
  • Clarifier les concepts de base de l’apprentissage automatique supervisé, tels que les types de modèles, les algorithmes courants et les métriques courantes
  • Connaître la librairie « tidymodels »
  • Implémenter un workflow complet de machine learning
  • Être capable d’appliquer et de paramétrer ces méthodes pour résoudre des problèmes professionnels
Pipeline de Machine Learning via Tidymodels en R
Prérequis
  • Connaissances de base en statistiques descriptives
  • Connaissances de base sur les principaux algorithmes de machine Learning
  • Connaissances intermédiaires de programmation R

Public visé

Data analysts, chargés d’études statistiques, data scientists


Programme détaillé

Machine Learning : méthodologie générale

Implémentation du workflow d’apprentissage supervisé via Tidymodels

  • Séparation de Training Data et Test Data : rsample
  • Data Pre-Processing et Feature Engineering: recipes
  • Définition et ajustement des modèles (Régressions, Gradient Boosting, Random Forest, Réseaux de neurones, etc.) : parsnip
  • Évaluation de la performance des modèles : yardstick
  • Tuning paramètres du modèle : tune and dials
  • Cross-Validation
  • Pipeline de traitement : workflows et workflowset
  • Sélectionner le meilleur modèle pour faire les prédictions finales