Business intelligence et big data

ECTS

3.0

Nombre d'heures

25.0

Niveau d'étude

Bac +5

Période de l'année

Semestre 3

Présentation

Cet UE propose une introduction à l’informatique décisionnelle et aux défis des données massives. Le but de ce module est d’être capable de mettre en place un système décisionnel à des fins d’analyse tout en répondant au besoin de performance des requêtes décisionnelles dans le contexte des données massives.

Objectifs

  • Principales notions liées à l’informatique décisionnelle et aux données massives : entrepôt de données, datamart, OLAP, processus ETL, caractéristiques des données massives.
  • Modélisation d’un entrepôt de données : modélisation multidimensionnelle, hypercube OLAP, stockage ROLAP, MOLAP et HOLAP, schéma en étoile et flocon de neige.
  • Interrogation d’un entrepôt de données : algèbre OLAP, extension SQL pour OLAP.
  • Optimisation de requêtes : plan d’exécution, index, vue matérialisée, partitionnement.
  • Fouille de données : règle d’association, recommandation et clustering.

Conditions d'admission

Avoir suivi un cours d'introduction aux bases de données (conception, modèle relationnel, normalisation, SQL).

Compétences visées

Mettre en place un système décisionnel permettant de regrouper les données d'une entreprise à des fins d'analyse :

  • concevoir et implémenter un entrepôt de données ;
  • définir le processus ETL permettant de peupler un entrepôt de données.

Exploiter un système décisionnel :

  • définir des requêtes OLAP pour interroger un entrepôt de données ;
  • faire du reporting afin d'afficher les résultats de requêtes OLAP sous une forme adaptée ;
  • utiliser différents algorithmes de fouilles de données pour répondre à différents besoins d'analyse.

Répondre au besoin de performance des requêtes décisionnelles :

  • analyser le plan d'exécution d'une requête ;
  • définir des structures d'optimisation adaptées pour optimiser une ou plusieurs requêtes.

Syllabus

  • Notions principales : entrepôt de données, datamart, OLAP, processus ETL, caractéristiques des données massives.
  • Modélisation multidimensionnelle : faits, dimensions, hypercube OLAP, stockage ROLAP, MOLAP et HOLAP, schéma en étoile et flocon de neige.
  • Processus ETL : extraction, transformation, nettoyage, chargement des données, notion de référentiel et métadonnées.
  • Requêtes OLAP : algèbre OLAP (drill-down, pivot, etc.), extension SQL pour OLAP.
  • Optimisation de requêtes : index btree, bitmap, bitmap de jointure, vue matérialisée, partitionnement.
  • Fouille de données : règle d’association, recommandation et clustering.

 

 

Diplômes intégrant cette UE

Méthode d'enseignementEn présence

Forme d'enseignementTotal

Type d'enseignementformation initiale, Contrat d'apprentissage, Contrat de professionnalisation

Composante

Logo

Nous contacter

15, rue de l'Hôtel Dieu
TSA 71117
86073 POITIERS Cedex 9 - France
Tél : (33) (0)5 49 45 30 00
Fax: (33) (0)5 49 45 30 50

Suivez-nous