Qu'est-ce qu'un Data Analyst ?


Craig Mundie

Les données deviennent la nouvelle matière première des entreprises

Craig Mundie, Conseiller principal auprès du PDG de Microsoft


Quels que soient le secteur d’activité, la taille et le statut de l’entreprise, de l’institut ou de l’administration, nul ne peut ignorer les masses de données disponibles et chacun se doit aujourd’hui de considérer toutes les opportunités offertes par les données.

La première d’entre elles réside dans le suivi opérationnel des processus internes. Des données de qualité, complètes et partagées permettent d’accroitre la connaissance interne, et ainsi de faciliter le pilotage par les décideurs. Le tableau de bord est l’outil usuellement retenu. Pour élaborer de tels tableaux, il faut évaluer les données disponibles, les corriger et les compléter si besoin, puis extraire ces données pour en fournir ensuite une synthèse explicite et exploitable. La capacité à mener des analyses descriptives classiques, des analyses exploratoires plus complexes, voire à mettre en œuvre des modèles reliant ces données, est un prérequis indispensable pour assurer la qualité de telles synthèses.

Une autre opportunité réside dans ce que l’on nomme communément l’open data, c’est-à-dire la mise à disposition de données brutes ou synthétisées à l’extérieur de l’entreprise ou de l’établissement qui les a produites. Ces « données ouvertes » permettent de générer des écosystèmes propices au traitement de problématiques métier par un réseau d’acteurs externes, des entreprises (parmi lesquelles des startups) mais également des académiques. Là-encore, les organisations doivent appréhender au mieux les données et informations mises à disposition, au risque de perdre en crédibilité.

Ces démarches autour de la donnée nécessitent une mise en valeur éclairée du patrimoine à disposition, et une réflexion quant à la collecte de nouvelles données, et sa mise en œuvre le cas échéant.

Le rôle endossé par le Data Analyst et ses principales missions

L’univers du big data a généré de nouveaux métiers, parmi lesquels les Data Engineers à même de déployer des solutions techniques pour le stockage, les calculs et la mise en production d’outils, et les Data Scientists dépositaires de connaissances pointues sur la manipulation et l’extraction d’information à l’aide du machine learning. Les Data Analysts constituent la plus grande masse des salariés impactés par l’analyse de données, leur défi est d’hybrider des traitements statistiques avec les finalités métier.

La fonction du Data Analyst consiste à ordonner les données des organisations et à en collecter de nouvelles. En convertissant ces masses de données, parfois non-structurées, en enseignements exploitables le Data Analyst facilite le partage d’informations et le pilotage des entreprises organisations. Ses travaux offrent ainsi un levier et un relais de croissance à l’entreprise qui l’emploie.

Ses principales missions sont :

  • Collecter et extraire des données
  • Tester et contrôler la qualité des données
  • Décrire les données de manière synthétique, via des tableaux, des graphiques et des rapports (data visualisation)
  • Mener des analyses exploratoires de données (data mining)
  • Mettre en œuvre des modélisations statistiques simples pour appréhender des données qualitatives ou quantitatives

Les compétences et qualités du métier

Le Data Analyst doit posséder des compétences issues de la statistique et de l’informatique pour mener à bien ces différentes tâches, sans omettre ses connaissances métier qui lui permettent de produire des interprétations éclairantes.

Afin de manipuler des jeux de données, les croiser, les nettoyer, il doit pouvoir invoquer un langage informatique spécialisé tel que R ou Python, et utiliser les librairies adéquates.

Pour décrire/explorer ses jeux de données, le Data Analyst doit pouvoir s’appuyer non seulement sur la statistique descriptive classique mais aussi l’analyse factorielle (ACP, ACM) et le clustering (CAH, K-means). Moins experts en algorithmique que les Data Scientists, les Data Analysts sauront mettre en œuvre des modélisations simples (régression linéaire, régression logistique), très souvent suffisantes pour des analyses éclairantes. Et si la complexité de la problématique requiert des méthodes avancées, ils pourront dialoguer avec des experts du machine learning, et utiliser des codes mis à disposition.

Pour aller plus loin...

  Envie de vous former au métier de Data Analyst ? Découvrez notre Certificat de Data Analyst

  Pour des informations complémentaires sur le métier de Data Analyst, consultez la fiche métier APEC