Programme d’études 2022-2023 | English | ||
Exploration et prédiction des données | |||
Unité d’enseignement du programme de Master en sciences informatiques (MONS) (Horaire jour) à la Faculté des Sciences |
Code | Type | Responsable | Coordonnées du service | Enseignant(s) |
---|---|---|---|---|
US-M1-SCINFO-022-M | UE optionnelle | GROSJEAN Philippe | S807 - Ecologie numérique |
|
Langue d’enseignement | Langue d’évaluation | HT(*) | HTPE(*) | HTPS(*) | HR(*) | HD(*) | Crédits | Pondération | Période d’enseignement |
---|---|---|---|---|---|---|---|---|---|
| Français | 0 | 36 | 0 | 0 | 0 | 3 | 3.00 | 1er quadrimestre |
Code(s) d’AA | Activité(s) d’apprentissage (AA) | HT(*) | HTPE(*) | HTPS(*) | HR(*) | HD(*) | Période d’enseignement | Pondération |
---|---|---|---|---|---|---|---|---|
S-BIOG-025 | Science des données III : exploration et prédiction | 0 | 36 | 0 | 0 | 0 | Q1 | 100.00% |
Unité d'enseignement |
---|
Objectifs par rapport aux acquis d'apprentissage du programme
Acquis d'apprentissage de l'UE
Etre capable de retrouver l'information pertinente dans un gros jeu de données à l'aide de techniques de fouillle de données et de classification supervisée, d'analyser correctement des données biologiques ayant une dépendance temporelle et d'analyser des données spatiales. Etre capable de présenter ses résultats de manière reproductible (rédaction de rapports) et utiliser des logiciels professionnels dans le domaine de la science des données : R, RStudio, R Markdown, git.
Contenu de l'UE : descriptif et cohérence pédagogique
Le cours est entièrement disponible en ligne : https://wp.sciviews.org. Les chapitres de cette UE sont:
- Classification supervisée I, LDA, principe général, matrice de confusion, métriques
- Classification supervisée II, validation croisée, AUC, k-nn, lvq, rpart, random forest
- Classification supervisée III, svm, réseaux de neurones, initiation au deep learning
- Séries temporelles I, caractéristiques, manipulation, acf, analyse spectrale
- Séries temporelles II, décomposition et régularisation
- Statistiques spatiales, initiation, représentations cartographiques, krigeage
Compétences préalables
Bases en science des données, en particulier, la gestion de projets d'analyse des données, l'importation et le remaniement des données, la visualisation à l'aide de graphiques et la rédaction de rapports reproductibles. Statistiques générales uni- et multivariées, modèles linéaires (généralisés) et non linéaires, technique d'ordination (ACP, AFC) et de classification non supervisée (CAH, K-means). Une mise à jour des compétences est possible via les deux premiers ouvrages des cours de science des données disponibles en ligne à partir de https://wp.sciviews.org.
Types d'activités
AA | Types d'activités |
---|---|
S-BIOG-025 |
|
Mode d'enseignement
AA | Mode d'enseignement |
---|---|
S-BIOG-025 |
|
Supports principaux non reproductibles
AA | Supports principaux non reproductibles |
---|---|
S-BIOG-025 | Le contenu du cours est en ligne: https://wp.sciviews.org |
Supports complémentaires non reproductibles
AA | Support complémentaires non reproductibles |
---|---|
S-BIOG-025 | Sans objet |
Autres références conseillées
AA | Autres références conseillées |
---|---|
S-BIOG-025 | Barnier, J., 2018. Introduction à R et au tidyverse (https://juba.github.io/tidyverse/index.html). Ismay, Ch. & Kim A.Y, 2018. Moderndive: An introduction to statistical and data science via R (http://moderndive.com). Wickham, H. & Grolemund, G, 2017. R for data science (http://r4ds.had.co.nz). Zar, J.H., 2010. Biostatistical analysis (5th ed.). Pearson Education, London. 944pp. Dagnelie, P., 2007. Statistique théorique et appliquée, Volumes I et II (2ème ed.). De Boeck & Larcier, Bruxelles. 511pp (vol. I) 734pp (vol. II). Venables W.N. & B.D. Ripley, 2002. Modern applied statistics with S-PLUS (4th ed.). Springer, New York, 495 pp. Legendre, P. & L. Legendre, 1998. Numerical ecology (2nd ed.). Springer Verlag, New York. 587 pp. |
Reports des notes d'AA d'une année à l'autre
AA | Reports des notes d'AA d'une année à l'autre |
---|---|
S-BIOG-025 | Non autorisé |
Evaluation du quadrimestre 1 (Q1) - type
AA | Type(s) et mode(s) d'évaluation du Q1 |
---|---|
S-BIOG-025 |
|
Evaluation du quadrimestre 1 (Q1) - commentaire
AA | Commentaire sur l'évaluation Q1 |
---|---|
S-BIOG-025 | L'évaluation se fait en continu tout au long du Q1. Les différents exercices et projets participent à l'établissement de la note. Les exercices sont regroupés par niveau de difficulté croissant de 1 à 4. Il faut obtenir une note supérieure à 50% pour les exercices de niveau 4 d'une part, et pour l'ensemble des exercices de niveau 1 à 3 d'autre part, sans quoi, la note la plus faible des deux constitue à elle seule la note finale de l'AA. Des pénalités sont appliquées si plus de 1/5 des exercices ne sont pas réalisés dans chaque module. Etant donné le type d'évaluation, la présence à l'ensemble des séances est obligatoire. Toute absence injustifiée à une séance sera sanctionnée d'un 0/20 pour le contenu concerné. Voir le plan du cours pour le détail du calcul par type d'exercice. |
Evaluation de l'épreuve de rattrapage du quadrimestre 1 (Q1) pour B1BA - type
AA | Type(s) et mode(s) d'évaluation rattrapage Q1(BAB1) |
---|---|
S-BIOG-025 |
|
Evaluation du quadrimestre 3 (Q3) - type
AA | Type(s) et mode(s) d'évaluation du Q3 |
---|---|
S-BIOG-025 |
|
Evaluation du quadrimestre 3 (Q3) - commentaire
AA | Commentaire sur l'évaluation Q3 |
---|---|
S-BIOG-025 | Etant donné que la note de cette AA est basée sur une évaluation continue de travaux qu'il n'est pas possible d'organiser durant l'été, il n'y a pas de seconde session. |