Statistique textuelle pour le Text Mining
Prochaine session
19 et 20 septembre 2022
Mettre en œuvre les méthodes de la statistique textuelle sur des corpus de nature différente (questions ouvertes, entretiens, mots associés, articles de presse, pages Web, etc.) à l’aide de logiciels spécifiques (IraMuTeQ, SpadT, R.TeMiS) Interpréter, présenter et valoriser les résultats.
Connaissance de base en statistique descriptive (formations Statistique 1 et Statistique 2)
Situer le Text Mining par rapport aux méthodes de la statistique textuelle et au développement des méthodes.
Identifier les apports de la statistique textuelle et intérêt par rapport à l’analyse qualitative et l’utilisation de logiciels d’aide à la lecture de textes (NVivo, Sonal).
Collecter des données textuelles non structurées et des métadonnées associés et les préparer en corpus analysables.
Mettre en œuvre le traitement d’un corpus par les méthodes de statistique textuelle
construire un lexique associé, lemmatiser (ou pas), préparer des tableaux lexicaux, et produire des statistiques uni ou multivariées associés.
Interpréter les résultats
mots du lexique, concordances, mots spécifiques, plans factoriels et arbres de classification, et les valoriser dans une publication.
Atelier : utiliser le logiciel adapté au corpus et à une problématique et en faire une restitution devant un public (par les stagiaires)
Afin de mobiliser les participants, de multiplier les échanges et de faciliter l’assimilation des connaissances, cette formation alterne exposés théoriques et applications pratiques / cas concrets / travaux sur ordinateur.