Statistique textuelle pour le Text Mining

 
  2 jours       1530       Avancé    
Objectifs de la formation
  • Explorer des corpus de nature différente (questions ouvertes, entretiens, mots associés, titres d’articles, etc.) au moyen de la statistique textuelle.
  • Repérer des structures, des spécificités, des thématiques puis valoriser les résultats.

Prérequis

Connaissance de base en statistique descriptive (formations Statistique 1 et Statistique 2) et en statistique multivariée (AFC).


Public visé

Chargés d’étude souhaitant comprendre et appliquer les concepts de la statistique textuelle au cœur des pratiques de Text mining.


Contenu

Origine et développement des méthodes d’analyse « automatique » de textes

  • Apports de la statistique textuelle et intérêt par rapport à l’analyse qualitative et au text mining

Les données textuelles, données plus ou moins structurées et métadonnées associés

  • Préparer les données en corpus analysable (textes et métadonnées) avec un tableur ou un éditeur de texte pour pouvoir les traiter avec les logiciels de statistique textuelle (la mise en forme pourra différer selon la taille des textes).

Mettre en œuvre les méthodes de statistique textuelle

  • Créer un tableau lexical et lemmatiser
  • Calculer les occurrences des mots et les visualiser sur un nuage de mots
  • Repérer et visualiser des cooccurrences
  • Identifier des spécificités à l’aide des métadonnées. Les analyses seront faites avec les logiciels d’analyse textuelle
  • Choisir la méthode et l’outil le plus adapté à sa problématique et ses données à analyser.

Interpréter et présenter les résultats

  • Lecture des concordances, des mots spécifiques, des aides à l’interprétation des analyses factorielles et des classifications
  • Valoriser les résultats dans une publication : présenter les tableaux statistiques et graphiques pertinents

Atelier : utiliser le logiciel adapté au corpus et à une problématique et en faire une restitution devant un public (les participants sont invités à venir avec des données qu’ils souhaitent exploiter)

Approche pédagogique

  Moyens pédagogiques

  • Exposé théorique de concepts
  • Démonstration
  • Expérimentation
  • Applications pratiques sur ordinateur
  • Etude de cas concrets
  • Échanges sur les pratiques et expériences des participants
  • Suivi pédagogique individualisé
  • Temps de questions / réponses
  • Exercices, quiz, forum etc.

Les participants sont invités à venir avec un jeu de données lié à leur activité professionnelle afin qu’ils les exploitent et présentent les résultats obtenus lors de la dernière partie de la formation.