Comprendre et adapter un Large Language Model (LLM)

Objectifs de la formation

Comprendre les principes des Large Language Models (LLM)
Savoir manipuler un LLM
Adapter un LLM à son corpus documentaire

Comprendre les principes des Large Language Models (LLM)
Savoir manipuler un LLM
Adapter un LLM à son corpus documentaire

Comprendre et adapter un Large Language Model (LLM)

Prérequis

Pour suivre cette formation, le contenu des formations Python intermédiaire et Les fondamentaux du Machine learning avec Python (ou avec R) doit être maîtrisé.

Prérequis

Pour suivre cette formation, le contenu des formations Python intermédiaire et Les fondamentaux du Machine learning avec Python (ou avec R) doit être maîtrisé.

Public visé

Développeurs, data scientists, ingénieurs, chefs de projet

Public visé

Développeurs, data scientists, ingénieurs, chefs de projet

Programme détaillé

Après une présentation des principaux concepts des LLM, la formation permet d’acquérir les bonnes pratiques pour utiliser un LLM et l’adapter à son propre corpus. Afin de faciliter l’apprentissage et la mise en pratique, toute la formation se fera sur le cluster de calculs de l’ENSAE.

Introduction et motivations (3h)

L’aspect Language Model des LLMs
L’aspect Large des LLMs
L’aspect Foundation Model des LLMs

La mécanique des LLMs (3h)

Tokenisation et embedding
Génération de texte
De GPT à ChatGPT

Pratique des LLMs par API (3h)

Les APIs pour LLMs
Les différentes tâches de NLP: le choix du modèle LLM en fonction de la tâche
Applications pratiques sur différentes tâches

Pratique des LLMs en local (3h)

Les enjeux hardware
La « quantization »
Utiliser un LLM en local

Les transformers et l’attention (2h)

Fonctionnement théorique des « transformers »
Le mécanisme d’« attention »

Adapter un LLM au cas d’usage (2h)

Choix d’un modèle adapté à son cas d’usage
La génération augmentée de récupération (RAG)
Unsupervised/supervised fine-tuning

Implémenter un RAG (2h)

Implémenter un RAG pour différentes tâches de LLMs
Considérations opérationnelles pour le RAG

Programme détaillé

Introduction et motivations (3h)

L’aspect Language Model des LLMs
L’aspect Large des LLMs
L’aspect Foundation Model des LLMs

La mécanique des LLMs (3h)

Tokenisation et embedding
Génération de texte
De GPT à ChatGPT

Pratique des LLMs par API (3h)

Les APIs pour LLMs
Les différentes tâches de NLP: le choix du modèle LLM en fonction de la tâche
Applications pratiques sur différentes tâches

Pratique des LLMs en local (3h)

Les enjeux hardware
La « quantization »
Utiliser un LLM en local

Les transformers et l’attention (2h)

Fonctionnement théorique des « transformers »
Le mécanisme d’« attention »

Adapter un LLM au cas d’usage (2h)

Choix d’un modèle adapté à son cas d’usage
La génération augmentée de récupération (RAG)
Unsupervised/supervised fine-tuning

Implémenter un RAG (2h)

Implémenter un RAG pour différentes tâches de LLMs
Considérations opérationnelles pour le RAG

Qu'est ce qu'un LLM ?

Un Large Language Model (LLM) est un modèle de traitement automatique du langage naturel (NLP) qui est capable de comprendre et de générer du texte de manière semblable à celle des humains.

Ces modèles utilisent des réseaux de neurones profonds pour analyser et générer du langage naturel. Ils sont appelés “grands” (large) car ils ont une grande capacité à traiter et générer du texte, souvent en raison du grand nombre de paramètres et de couches dans leur architecture.

Les LLM sont généralement entraînés sur de vastes ensembles de données textuelles pour apprendre les structures et les modèles linguistiques. Ils peuvent être utilisés pour diverses tâches de traitement du langage naturel, telles que la génération de texte, la traduction automatique, la réponse aux questions, la compréhension du langage naturel, la résumé automatique, etc.

Des exemples célèbres de LLM incluent GPT (Generative Pre-trained Transformer) développé par OpenAI, BERT (Bidirectional Encoder Representations from Transformers) développé par Google, et d’autres modèles développés par diverses institutions de recherche et entreprises technologiques. Ces modèles ont eu un impact significatif dans le domaine du traitement automatique du langage naturel et sont largement utilisés dans une variété d’applications.

Qu'est ce qu'un LLM ?

Un Large Language Model (LLM) est un modèle de traitement automatique du langage naturel (NLP) qui est capable de comprendre et de générer du texte de manière semblable à celle des humains.

Approche pédagogique

Moyens pédagogiques

Exposé théorique de concepts
Applications pratiques sur ordinateur
Échanges sur les pratiques et expériences des participants
Temps de questions / réponses
Exercices, quiz, forum etc.

Méthodes pédagogiques

Méthode expositive
Méthode active

Mode de financement	En quoi consiste-t-il ?	A qui s'adresse-t-il ?	Pour quel type de formation ?
Le Plan de développement des compétences	Le plan de développement des compétences rassemble l’ensemble des actions de formation définies dans le cadre de la politique de de gestion des ressources humaines de votre entreprise. Le PDC vous permet de suivre des actions de formation à l’initiative de votre employeur. Il comprend alors un maintien de la rémunération professionnelle, un coût de formation à la charge de l’entreprise et un temps de formation sur le temps de travail. Pour davantage d’information sur les possibilités de prise en charge, adressez-vous à votre service des ressources humaines.	Aux salariés	Pour toutes les formations
Le Compte Personnel de Formation (CPF) Anciennement Droit individuel à la formation (DIF)	Le CPF a été créé pour vous permettre de disposer d’un crédit formation (en euros depuis le 1er janvier 2019) afin de vous former tout au long de votre vie et d’ainsi augmenter votre employabilité. Votre CPF est également utilisable en période de chômage. Nos formations certifiantes sont reconnues d’Etat et inscrites au Répertoire Spécifique. Elles sont référencées sur Mon Compte Formation et finançables par le CPF. Depuis septembre 2020, les entreprises peuvent abonder directement le compte CPF des salariés. L’employeur peut ainsi financer le reste à charge du projet de formation de son salarié. Ici, ni convention ou contrat de formation ne sont signés, ce sont les Conditions Générales d’Utilisation (CGU) du CPF qui s’appliquent. Plus d'informations sur service-public.fr	Aux salariés et aux demandeurs d'emploi	Pour les formations certifiantes
Reconversion ou promotion par alternance (Pro-A, ex-Période de Professionnalisation)	La Reconversion ou promotion par alternance a pour objectif de favoriser l’évolution professionnelle et le maintien dans l’emploi des salariés. Elle prend la forme d’un parcours de formation personnalisé alternant enseignements et activité professionnelle. Plus d'informations sur service-public.fr	Aux salariés	Pour les formations certifiantes
L’Aide Individuelle à la Formation (AIF)	L’AIF contribue au financement des frais pédagogiques de votre formation lorsque les dispositifs de financements existants (collectivités territoriales, OPCO,...) ne peuvent prendre en charge partiellement ou entièrement votre projet formation. Votre conseiller Pôle emploi validera votre projet au regard du contenu et de la durée de la formation, de son coût, mais aussi de son efficacité pour votre retour à l’emploi. Plus d'informations sur pole-emploi.fr	Aux demandeurs d'emploi	Pour toutes les formations
Le Conseil Régional ou le Conseil Départemental	La plupart des collectivités territoriales mettent en place des dispositifs d’aide à la formation professionnelle pour une première recherche d’emploi ou une reconversion professionnelle. Chaque région / département définit sa propre politique en termes de financement des formations. Renseignez-vous auprès du Conseil dont vous dépendez.		Pour toutes les formations
FINANCEMENT DES ACTIONS DE RECLASSEMENT PAR L’EMPLOYEUR	Dans le cadre d’un licenciement économique dans une entreprise de plus de 1000 salariés, le congé de reclassement permet au salarié de se former pendant la durée de son accompagnement. Le financement de la formation dans le cas d’un congé de reclassement est financé par l’employeur et l’OPCO auquel l’entreprise est rattachée. Plus d'informations sur service-public.fr	Aux salariés en congé de reclassement	Pour toutes les formations
FINANCEMENT DE LA CPAM ET DE L’AGEFIPH	Les victimes d’accidents du travail et de maladies professionnelles peuvent bénéficier de l’aide de la CPAM (Caisse primaire d’assurance maladie) qui propose un abondement du CPF. Pour les travailleurs handicapés, l’organisme AGEFIPH (Association de gestion de fonds pour l’insertion professionnelle des handicapés) peut créditer une somme complémentaire sur le CPF.	Aux personnes porteuses d’un handicap	Pour les formations certifiantes