Mettre en œuvre et utiliser les outils informatiques des Big Data
3 jours 2000 Avancé

Connaître les évolutions technologiques qui révolutionnent l’architecture technique. Savoir quels sont les contraintes techniques, les performances, les caractéristiques d’une architecture en grille hautement performante et positionner un système Big Data dans le plan d’urbanisme.
Bonnes connaissances informatiques (systèmes et base de données), requêtage SQL.
Principes de distribution du stockage et des calculs (dont MapReduce)
Composants et fonctionnement d’un cluster Hadoop. Utilisation du shell et des interfaces de gestion (outil d’administration, Hue). Options de déploiement d’un cluster (dont le cloud computing, revue des principaux fournisseurs)
Organisation des données avec Hive (création de bases, de tables, requêtage). Utilisation des différents formats de fichiers
Les utilisations de Spark, moteur de calcul distribué, et de ses différentes bibliothèques. Introduction aux outils des big data de traitement en flux des données (temps réel)
Afin de mobiliser les participants, de multiplier les échanges et de faciliter l’assimilation des connaissances, cette formation alterne exposés théoriques et applications pratiques / cas concrets / travaux sur ordinateur.
Dernière modification du descriptif de cette formation : 10/12/2020