ECTS
6 crédits
Composante
Sciences Fondamentales et Appliquées
Période de l'année
Semestre 1
Description
Cet enseignement permet d'apporter les connaissances nécessaires à l'analyse statistique de données multivariées : visualisation, inférence préliminaire et interprétation.
Objectifs
Les étudiants aborderont et pourront mettre en pratique les principales méthodes d’analyse statistique de données multivariées telles que l’analyse en composantes principales, l’analyse factorielle discriminante et des méthodes de clustering pour synthétiser l’information contenue dans des jeux de données.
Heures d'enseignement
- TPTP20h
- TDTD10h
- CMCM20h
Pré-requis obligatoires
Analyse matricielle; Probabilités
Programme détaillé
- Analyse en composantes principales (ACP)
- Problème de clustering. Clustering k-means
- Clustering hiérarchique
- Analyse Factorielle des Correspondances
- Analyse Discriminante; courbes ROC
- Analyse des Correspondances Multiples
Compétences visées
A l'issue de ce cours l'étudiant devra savoir mettre en pratique sous les logiciels R ou Python des outils d’analyse statistique descriptive multivariée tels que l’analyse en composantes principales, l’analyse factorielle des correspondances, l’analyse factorielle discriminante ainsi que les méthodes de clustering comme k-means et clustering hiérarchique. Il devra également savoir interpréter les résultats obtenus.
Bibliographie
- Saporta, Probabilités, analyse des données et statistique, Editions TECHNIP, 2006.
- Husson, S. Lê, J. Pagès, Analyse de données avec R, 2ème édition, Presse Universitaire de Rennes, 2016.