Programme d’études 2023-2024 | English | ||
Science des données II : analyse et modélisation | |||
Unité d’enseignement du programme de Bachelier en sciences biologiques (MONS) (Horaire jour) à la Faculté des Sciences |
Code | Type | Responsable | Coordonnées du service | Enseignant(s) |
---|---|---|---|---|
US-B3-SCBIOL-006-M | UE Obligatoire | GROSJEAN Philippe | S807 - Ecologie numérique |
|
Langue d’enseignement | Langue d’évaluation | HT(*) | HTPE(*) | HTPS(*) | HR(*) | HD(*) | Crédits | Pondération | Période d’enseignement |
---|---|---|---|---|---|---|---|---|---|
| Français | 0 | 60 | 0 | 0 | 0 | 5 | 5.00 | Année |
Code(s) d’AA | Activité(s) d’apprentissage (AA) | HT(*) | HTPE(*) | HTPS(*) | HR(*) | HD(*) | Période d’enseignement | Pondération |
---|---|---|---|---|---|---|---|---|
S-BIOG-015 | Sciences de données II : modélisation | 0 | 30 | 0 | 0 | 0 | Q1 | |
S-BIOG-061 | Science des données II : analyse | 0 | 30 | 0 | 0 | 0 | Q2 |
Unité d'enseignement | ||
---|---|---|
US-B2-SCBIOL-006-M Science des données I : visualisation et inférence |
Objectifs par rapport aux acquis d'apprentissage du programme
Acquis d'apprentissage de l'UE
Etre capable d'analyser correctement des données biologiques variées. En particuliers, les différentes modèles linéaires (modèle linéaire, modèle linéaire généralisé, modèles non-linéaire,...), les méthodes d'ordination (ACP et AFC) et de classification (dendrogramme) sont étudiés. Apprendre à décrire correctement les données, et à tester les conditions d'application des techniques envisagées. Apprendre également à tirer des conclusions appropriées par rapport à l'analyse effectuée, et à les formuler de manière rigoureuse. Nous insistons également sur la présentation des résultats (rédaction de rapports) et sur l'utilisation de logiciels professionnels dans le domaine de la science des données : R, RStudio, R Markdown, git.
Contenu de l'UE : descriptif et cohérence pédagogique
Le cours est entièrement disponible en ligne : https://wp.sciviews.org. Les chapitres de cette AA sont:
- Régression linéaire simple et analyse des résidus (partie I)
- Régressions linéaire multiple et polynomiale, analyse des résidus (partie II)
- Modèles linéaires et matrices de contraste
- Modèles linéaires généralisés
- Modèles non linéaire
- Classification ascendante hiérarchique, K-moyennes, matrices de distances, indices de biodiversité
- ACP et AFC
- AFM et big data
- Bases de données et MDS
- Données ouvertes et SOM
Compétences préalables
Bases en science des données, en particulier, la gestion de projets d'analyse des données, l'importation et le remaniement des données, la visualisation à l'aide de graphiques et la rédaction de rapports reproductibles. Statistiques uni- et bivariées de base, y compris ANOVA, variance, covariance et corrélation. Utilisation des logiciels R, RStudio, R Markdown et git. Une mise à niveau des connaissances avant le cours est possible via le matériel en ligne du premier cours de science des données à https://wp.sciviews.org.
Type(s) et mode(s) d'évaluation Q1 pour l'UE
Commentaire sur les évaluations Q1 de l'UE
L'évaluation de la progression se fait en continu tout au long des séances. La présence aux séances est donc obligatoire. Les absences injustifiées sont sanctionnées.
Méthode de calcul de la note globale pour l'évaluation Q1 de l'UE
La pondération entre les AA du Q1 et du Q2 est de 50/50 (notes des évaluations continues, voir AA correspondante). Il faut avoir obtenu au minimum 8/20 à chaque AA, sans quoi la note de l'AA la plus faible est utilisée pour la note finale de l'UE. En cas d'échec, aucun report de note d'AA ne sera possible d'une année à l'autre.
Type(s) et mode(s) d'évaluation rattrapage Q1 (BAB1) pour l'UE
Commentaire sur les évaluations rattrapage Q1 (BAB1) de l'UE
Sans objet
Méthode de calcul de la note globale pour l'évaluation rattrapage Q1 (BAB1) de l'UE
Sans objet
Type(s) et mode(s) d'évaluations Q2 pour l'UE
Commentaire sur les évaluations Q2 de l'UE
L'évaluation de la progression se fait en continu tout au long des séances. La présence aux séances est donc obligatoire. Les absences injustifiées sont sanctionnées.
Méthode de calcul de la note globale pour l'évaluation Q2 de l'UE
La pondération entre les AA du Q1 et du Q2 est de 50/50 (notes des évaluations continues, voir AA correspondante). Il faut avoir obtenu au minimum 8/20 à chaque AA, sans quoi la note de l'AA la plus faible est utilisée pour la note finale de l'UE. En cas d'échec, aucun report de note d'AA ne sera possible d'une année académique à l'autre.
Type(s) et mode(s) d'évaluations Q3 pour l'UE
Commentaire sur les évaluations Q3 de l'UE
Etant donné que la note de cette UE est basée sur une évaluation continue de travaux qu'il n'est pas possible d'organiser durant l'été, il n'y a pas de seconde session.
Méthode de calcul de la note globale pour l'évaluation Q3 de l'UE
Sans objet
Types d'activités
AA | Types d'activités |
---|---|
S-BIOG-015 |
|
S-BIOG-061 |
|
Mode d'enseignement
AA | Mode d'enseignement |
---|---|
S-BIOG-015 |
|
S-BIOG-061 |
|
Supports principaux non reproductibles
AA | Supports principaux non reproductibles |
---|---|
S-BIOG-015 | Le contenu du cours est en ligne: https://wp.sciviews.org |
S-BIOG-061 | Le contenu du cours est en ligne: https://wp.sciviews.org |
Supports complémentaires non reproductibles
AA | Support complémentaires non reproductibles |
---|---|
S-BIOG-015 | Sans objet |
S-BIOG-061 | Sans objet |
Autres références conseillées
AA | Autres références conseillées |
---|---|
S-BIOG-015 | Barnier, J., 2018. Introduction à R et au tidyverse (https://juba.github.io/tidyverse/index.html). Ismay, Ch. & Kim A.Y, 2018. Moderndive: An introduction to statistical and data science via R (http://moderndive.com). Wickham, H. & Grolemund, G, 2017. R for data science (http://r4ds.had.co.nz). Zar, J.H., 2010. Biostatistical analysis (5th ed.). Pearson Education, London. 944pp. Husson, F., S. Lê & J. Pagès, 2009. Analyse de données avec R. Presses universitaires de Rennes, Rennes. 224pp. Cornillon, P.A. Et al, 2008. Statistiques avec R. Presses Universitaires de Rennes. 257pp. Dagnelie, P., 2007. Statistique théorique et appliquée, Volumes I et II (2ème ed.). De Boeck & Larcier, Bruxelles. 511pp (vol. I) 734pp (vol. II). |
S-BIOG-061 | Barnier, J., 2018. Introduction à R et au tidyverse (https://juba.github.io/tidyverse/index.html). Ismay, Ch. & Kim A.Y, 2018. Moderndive: An introduction to statistical and data science via R (http://moderndive.com). Wickham, H. & Grolemund, G, 2017. R for data science (http://r4ds.had.co.nz). Zar, J.H., 2010. Biostatistical analysis (5th ed.). Pearson Education, London. 944pp. Husson, F., S. Lê & J. Pagès, 2009. Analyse de données avec R. Presses universitaires de Rennes, Rennes. 224pp. Cornillon, P.A. Et al, 2008. Statistiques avec R. Presses Universitaires de Rennes. 257pp. Dagnelie, P., 2007. Statistique théorique et appliquée, Volumes I et II (2ème ed.). De Boeck & Larcier, Bruxelles. 511pp (vol. I) 734pp (vol. II). Sans objet |