Statistique textuelle pour le Text Mining

 
  Toutes les formations  Data science
  2 jours       1420       Avancé    
  Prochaine session
29 et 30 novembre 2018
Objectifs

Mettre en œuvre les méthodes de la statistique textuelle sur des corpus de nature différente (questions ouvertes, entretiens, mots associés, articles de presse, pages Web, etc.) à l’aide de logiciels spécifiques (IraMuTeQ, SpadT, R.TeMiS) Interpréter, présenter et valoriser les résultats.


Prérequis

Connaissance de base en statistique descriptive (formations Statistique 1 et Statistique 2)


Contenu

Situer le Text Mining par rapport aux méthodes de la statistique textuelle et au développement des méthodes.

Identifier les apports de la statistique textuelle et intérêt par rapport à l’analyse qualitative et l’utilisation de logiciels d’aide à la lecture de textes (NVivo, Sonal).

Collecter des données textuelles non structurées et des métadonnées associés et les préparer en corpus analysables.

Mettre en œuvre le traitement d’un corpus par les méthodes de statistique textuelle

construire un lexique associé, lemmatiser (ou pas), préparer des tableaux lexicaux, et produire des statistiques uni ou multivariées associés.

Interpréter les résultats

mots du lexique, concordances, mots spécifiques, plans factoriels et arbres de classification, et les valoriser dans une publication.

Utiliser le logiciel adapté au corpus et à une problématique et en faire une restitution devant un public (par les stagiaires)


Modalités pédagogiques

Afin de mobiliser les participants, de multiplier les échanges et de faciliter l’assimilation des connaissances, cette formation alterne exposés théoriques et applications pratiques / cas concrets / travaux sur ordinateur.