Niveau d'étude
Bac +5
ECTS
3 crédits
Composante
Sciences Fondamentales et Appliquées
Volume horaire
25h
Période de l'année
Semestre 3
Description
Cet UE propose une introduction à l’informatique décisionnelle et aux défis des données massives. Le but de ce module est d’être capable de mettre en place un système décisionnel à des fins d’analyse tout en répondant au besoin de performance des requêtes décisionnelles dans le contexte des données massives.
Objectifs
- Principales notions liées à l’informatique décisionnelle et aux données massives : entrepôt de données, datamart, OLAP, processus ETL, caractéristiques des données massives.
- Modélisation d’un entrepôt de données : modélisation multidimensionnelle, hypercube OLAP, stockage ROLAP, MOLAP et HOLAP, schéma en étoile et flocon de neige.
- Interrogation d’un entrepôt de données : algèbre OLAP, extension SQL pour OLAP.
- Optimisation de requêtes : plan d’exécution, index, vue matérialisée, partitionnement.
- Fouille de données : règle d’association, recommandation et clustering.
Heures d'enseignement
- Business intelligence et big data - TDTD8h
- Business intelligence et big data - TPTP8h
- Business intelligence et big data - CMCM9h
Pré-requis nécessaires
Avoir suivi un cours d'introduction aux bases de données (conception, modèle relationnel, normalisation, SQL).
Syllabus
- Notions principales : entrepôt de données, datamart, OLAP, processus ETL, caractéristiques des données massives.
- Modélisation multidimensionnelle : faits, dimensions, hypercube OLAP, stockage ROLAP, MOLAP et HOLAP, schéma en étoile et flocon de neige.
- Processus ETL : extraction, transformation, nettoyage, chargement des données, notion de référentiel et métadonnées.
- Requêtes OLAP : algèbre OLAP (drill-down, pivot, etc.), extension SQL pour OLAP.
- Optimisation de requêtes : index btree, bitmap, bitmap de jointure, vue matérialisée, partitionnement.
- Fouille de données : règle d’association, recommandation et clustering.
Compétences visées
Mettre en place un système décisionnel permettant de regrouper les données d'une entreprise à des fins d'analyse :
- concevoir et implémenter un entrepôt de données ;
- définir le processus ETL permettant de peupler un entrepôt de données.
Exploiter un système décisionnel :
- définir des requêtes OLAP pour interroger un entrepôt de données ;
- faire du reporting afin d'afficher les résultats de requêtes OLAP sous une forme adaptée ;
- utiliser différents algorithmes de fouilles de données pour répondre à différents besoins d'analyse.
Répondre au besoin de performance des requêtes décisionnelles :
- analyser le plan d'exécution d'une requête ;
- définir des structures d'optimisation adaptées pour optimiser une ou plusieurs requêtes.