Les données structurées sur le web

 
  Toutes les formations  Data science
  2 jours       1420       Initiation    
Objectifs

Comprendre le fonctionnement du web dans une optique d’extraction de données.


Contenu

La formation présente les formats de données courants disponibles sur le web. Chaque méthode fait l’objet d’une présentation théorique et d’exemples pratiques de programmation. La formation s’adresse à tous les utilisateurs de données statistiques, habitués aux méthodes usuelles de gestion de données.

Les types de données disponibles sur le web

Explication des formats HTML, XML, JSON, RSS.

Concepts de protocoles réseau

Notions de client/serveur, TCP/IP, requêtes HTTP GET/POST.

Langages de requêtes

Extraire de l’information d’un fichier HTML/XML avec Xpath, CSS selectors, regex.


Modalités pédagogiques

Afin de mobiliser les participants, de multiplier les échanges et de faciliter l’assimilation des connaissances, cette formation alterne exposés théoriques et applications pratiques / cas concrets / travaux sur ordinateur.