Informatique décisionnelle et big data

ECTS

6.0

Présentation

Cette UE propose une introduction à l’informatique décisionnelle et aux défis liés à la gestion des données massives (big data).

Entrepôt de données : modélisation multidimensionnelle, représentation logique (ROLAP, MOLAP, HOLAP), processus ETL, requête OLAP.
Optimisation de requêtes : plan d'exécution, modèle de coût, algorithmes de jointures, indexation, vue matérialisée, partitionnement.
Techniques pour le traitement des big data : bases de données distribuées, framework de type MapReduce.
Introduction à la fouille de données : règle d'association, recommandation, clustering, arbre de décision.

Objectifs

Le but de ce module est d’être capable de mettre en place un système décisionnel à des fins d’analyse tout en répondant au besoin de performance des requêtes décisionnelles dans le contexte des données massives.

Conditions d'admission

Avoir déjà suivi un cours d'introduction aux bases de données (conception, modèle relationnel, normalisation, SQL).
Connaître les grands principes du fonctionnement d'un système de gestion de base de données (architecture, organisation physique, utilisation de la mémoire centrale).

Compétences visées

Les principales compétences développées sont les suivantes.

* Mettre en place un système décisionnel permettant de regrouper les données d'une entreprise à des fins d'analyse.
    - Concevoir et implémenter un entrepôt de données.
    - Définir le processus ETL (Extraction, Transformation, Chargement) permettant de peupler un entrepôt de données.
* Exploiter un système décisionnel    
    - Définir des requêtes OLAP pour interroger un entrepôt de données.
    - Faire du reporting afin d'afficher les résultats de requêtes OLAP sous une forme adaptée.
    - Utiliser différents algorithmes de fouilles de données pour répondre à différents besoins d'analyse.
* Répondre au besoin de performance des requêtes décisionnelles
    - Analyser un plan d'exécution d'une requête.
    - Définir des structures d'optimisation adaptées (index, vue matérialisée, partitionnement) pour optimiser une ou plusieurs requêtes.
    - Mettre en place des solutions distribuées (Bases de données distribuées, framework MapReduce) pour traiter des données massives.

Diplômes intégrant cette UE

Composante

Etudiants internationaux

Ouvert aux étudiants en échange
Logo

Nous contacter

15, rue de l'Hôtel Dieu
TSA 71117
86073 POITIERS Cedex 9 - France
Tél : (33) (0)5 49 45 30 00
Fax: (33) (0)5 49 45 30 50

Réseaux sociaux