Les données structurées sur le web
Comprendre le fonctionnement du web dans une optique d’extraction de données.
La formation présente les formats de données courants disponibles sur le web. Chaque méthode fait l’objet d’une présentation théorique et d’exemples pratiques de programmation. La formation s’adresse à tous les utilisateurs de données statistiques, habitués aux méthodes usuelles de gestion de données.
Les types de données disponibles sur le web
Explication des formats HTML, XML, JSON, RSS.
Concepts de protocoles réseau
Notions de client/serveur, TCP/IP, requêtes HTTP GET/POST.
Langages de requêtes
Extraire de l’information d’un fichier HTML/XML avec Xpath, CSS selectors, regex.
Afin de mobiliser les participants, de multiplier les échanges et de faciliter l’assimilation des connaissances, cette formation alterne exposés théoriques et applications pratiques / cas concrets / travaux sur ordinateur.