020IBDES4

Intégration du Big Data

Ce cours couvre les différentes approches d'intégration de données en général : l'intégration selon une vue matérialisée (Entrepôt de données) et l'intégration selon une vue virtuelle (médiateur), ainsi que les approches plus spécifiques au Big Data, tel que les Data Lakes, l'architecture Lambda (Streams, Batch processing), les pipelines d’intégration et de traitement, et enfin l'approche sémantique pour la description des données avec RDF et OWL. Ce cours couvre de plus les techniques, les outils et l'environnement à mettre en place pour pouvoir assurer cette intégration des données massives (Talend Big Data Integration Studio, Aoache Nifi, ...), en traitant surtout la problématique liée à la Variété de ces données qui peuvent être structurées, semi-structurées (XML, JSON), ou non-structurées (texte, etc..), et qui sont stockées dans des BDD relationnelles, ou dans des Bases de données NoSQL (Bases clé-valeur, Bases à famille de colonnes, Bases orientées Document, ou sous forme de Graphes).


Temps présentiel : 35 heures


Charge de travail étudiant : 65 heures


Méthode(s) d'évaluation : Examen écrit, Travail personnel

Ce cours est proposé dans les diplômes suivants
 Diplôme d'ingénieur - spécialité génie informatique et communications - option : génie logiciel