Programme des cours 2020-2021
ATGA2031-1  
Sciences appliquées à l'agronomie VIII, Informatique appliquée
Durée :
30h Th
Nombre de crédits :
Bachelier en agronomie2
Nom du professeur :
Robert Milano
Langue(s) de l'unité d'enseignement :
Langue française
Organisation et évaluation :
Enseignement au premier quadrimestre, examen en janvier
Unités d'enseignement prérequises et corequises :
Les unités prérequises ou corequises sont présentées au sein de chaque programme
Contenus de l'unité d'enseignement :
Ce cours est une initiation au logiciel R, logiciel permettant de réaliser des analyses statistiques.
Dès lors, pour utiliser de façon cohérente, efficiente et sensée un tel logiciel, l'étudiant devra  -- conjointement à l'apprentissage des commandes de base du logiciel R -- étayer cette initiation de notions élémentaires de la statistique.
Ce cours se donne donc pour objectif une approche concrète des notions statistiques les plus courantes et des opérations de base en R (vecteurs, fonctions, boucles), point de départ de toute analyse de données bio-agronomiques. Durant les séances sur PC, seront étudiés et "réalisés" en R les chapitres suivants :


A. Statistiques descriptives
A.1. Variables discrètes, continues, quantitatives, qualitatives, ordinales, nominales.
A.2. Statistiques à une variable
*Moyenne, médiane, fréquences, étendue, variance, écart-type, quartiles, score Z, intervalle interquartile, valeurs extrêmes.
*Table des effectifs et des fréquences (pourcentages); Effectifs cumulés; Fréquences cumulées.
*Diagramme en bâtons; Diagramme circulaire; Histogramme; Box-plot; Q-Q-Plot; strip-chart, etc.
*Fonction de répartitions.
A.3. Statistiques à deux variables
A.3.1. - Deux variables qualitatives : tableau de contingence, diagramme en mosaïques, distributions marginales, probabilités conditionnelles.
A.3.2. - Une variable qualitative et une variable quantitative : statistiques groupées, Box-plot parallèles, événements rares ou aberrants. 
A.3.3. - Deux variables quantitatives : nuage de points, corrélation, régression linéaire, ajustement des moindres carrés, coefficient de détermination.
B.  Statistiques multivariées (Plus de deux variables)
B1. Classification :
B1.1. Nuages de points sur tous les couples des variables numériques d'une base de donnée (indentification de liens linéaires éventuels).
B1.2. Diagrammes en étoiles.
B1.3. dendrogrammes
B2. Arbre de décision
B3. Analyse discriminante linéaire
B4. Analyse factorielle
C. Etudes des vecteurs, fonctions et boucles récurrentes en R.
C1. Opérations sur les vecteurs
C2. Fonctions d'une variable : définition en R, graphique, calcul des extrema, calculs des racines, intersections de fonctions.
C3. Fonctions de 2 variables : définition en R, études graphique(s), identification des propriétés de ces fontions sur base d'explorations graphiques (variation des paramètres).
C4. Création d'une boucle en R. "Bouclage" sur des fonctions graphiques. Calculs de suites récurrentes.    
EXERCICES/TP
Les notes du cours théorique contiennent des dizaines d'exercices variés dont certains sont résolus en classe. De plus, les étudiants reçoivent un document reprenant des dizaines d'énoncés. Une majorité de ces exercices renvoient à des bases de données mises à disposition des étudiants. Certains exercices sont résolus pendant les séances théoriques ou durant les séances pratiques sur ordinateur, d'autres sont proposés mais facultatifs. 
Acquis d'apprentissage (objectifs d'apprentissage) de l'unité d'enseignement :
- Connaître les méthodes de calcul de la statistique descriptive.
- Etudes de cas. Appliquer ces méthodes à des cas concrets (sur des bases de données). 
- Justifier le choix des méthodes utilisées.
- Discuter les avantages, inconvénients et la pertinence des graphiques, tables et calculs choisis
- Evaluer la pertinence des résultats
- Utilisation de R
Savoirs et compétences prérequis :
- Maîtrise de Windows (gestion des fichiers, etc.)
- Maîtrise du cours de mathématiques (Dérivée - Fonctions exponentielle et logarithmique - Intégration - Analyse combinatoire)
Activités d'apprentissage prévues et méthodes d'enseignement :
- Présentiel. Explications orales (+ support de cours écrit) des théories impliquées dans les traveaux pratiques sur PC. 
- L'étudiant peut installer le logiciel R sur son propre PC (logiciel gratuit) et l'utiliser durant les séances d'exercices.
- Des bases de données seront fournies aux étudiants afin qu'ils puissent s'exercer sur des cas concrets. De plus, les notes de cours proposent de nombreux exercices, dont certains feront l'objet d'une correction durant les TP. Des exercices supplémentaires seront aussi distribués durant les TP.
- Remarque : les notes de cours ET les informations données oralement durant les cours sont matières d'examen.
Mode d'enseignement (présentiel, à distance, hybride) :
- Présentiel. Explications orales (+ support de cours écrit) des théories impliquées dans les traveaux pratiques sur PC. 
- L'étudiant peut installer le logiciel R sur son propre PC (logiciel gratuit) et l'utiliser durant les séances d'exercices.
- Des bases de données seront fournies aux étudiants afin qu'ils puissent s'exercer sur des cas concrets. De plus, les notes de cours proposent de nombreux exercices, dont certains feront l'objet d'une correction durant les TP. Des exercices supplémentaires seront aussi distribués durant les TP.
- Remarque : les notes de cours ET les informations données oralement durant les cours sont matières d'examen.
Lectures recommandées ou obligatoires et notes de cours :
Des notes de cours seront transmises durant la progression du cours.
- Statistique Théorique et AppliquéeTome 1 , Pierre Dagnelie, De Boeck   (-> disponible à la bibliothèque de l'ISIa).
- Théorie et méthodes statistiques (Applications agronomiques)Tome 2, Pierre Dagnelie, De Boeck     (-> disponible à la bibliothèque de l'ISIa).
- Statistique exploratoire multidimensionnelle. Lebart Piron Morineau, Dunod 1995     (-> disponible à la bibliothèque de l'ISIa).
- Le Logiciel R, Pierre Lafaye de Michaux et al., Springer  (-> disponible à la bibliothèque de l'ISIa).
- Internet offre de nombreux documents introduisant au logiciel R. Par exemple : R pour débutants   ( -> transmis au cours).
- Biostatistique pour les sciences de la vie et de la santé, Mario Triola, Pearson Education
- Un site intéressant :  http://webapps.fundp.ac.be/biostats  -> apprentissage des Biostatistiques de la FUNDP (responsable académique : Eric Depiereux)
- Probabilités, analyse des données et Statistique, Gilbert Saporta, éditions TECHNIP  (-> disponible à la bibliothèque de l'ISIa)
- Méthodes statistiques en biologie et en agronomie, André Vessereau, Editeur : Tec&Doc;  2e édition (1999)   (-> disponible à la bibliothèque de l'ISIa)
- Initiation à la statistique avec R - 2e éd. - Cours, exemples, exercices et problèmes corrigés, Frédéric Bertrand, Myriam Maumy-Bertrand, Editeur : Dunod;  2e édition (2014)   (-> disponible à la bibliothèque de l'ISIa)
Modalités d'évaluation et critères :
Conformément à la circulaire de rentrée académique 2020-2021, un code couleur a été établi pour l'enseignement supérieur dans le cadre de la lutte contre le coronavirus. Les engagements pédagogiques ont été rédigés sur base du code « jaune ».
Exercices et étude de cas concrets sur ordinateur avec le logiciel R. L'étudiant choisira la méthode la plus appropriée pour l'étude des bases de données et des problèmes proposés.
Ce choix devra être justifié. Il s'agira de montrer sa compréhension des concepts mis en pratique dans cette étude. L'étudiant justifiera ses méthodes d'analyse et commentera les résultats obtenus par le logiciel R.
L'étudiant fera preuve d'une approche critique sur la pertinence de sa démarche et expliquera clairement les résultats obtenus.
La cote minimum de 10/20 doit être atteinte afin de réussir le cours (sauf décision contraire du jury de délibération).
 
ATTENTION : Si le code rouge (Covid-19) et maintenu durant les examens et si l'épreuve pratique sur PC de ce cours ne peut se faire dans les locaux de la HECH, l'épreuve écrite sera transformée en un examen oral effectué à distance via TEAMS. A cet effet, l'étudiant disposera d'un ordinateur équipé du logiciel RStudio, d'une bonne connection internet, d'une caméra permettant de contrôler le déroulement de l'examen et d'un micro permettant les échanges questions-réponses.
Si l'étudiant de heurte à des dificultés techniques, il doit impérativement en informer les autorités de la HECh le plus rapidement possible. Dans ce cas, l'étudiant sera invité à passer son examen oral depuis les locaux de la HECh où un ordinateur sera mis à sa disposition. Un horaire spécifique devra être mis en place pour les étudiants confrontés à ces difficultés techniques.
Stage(s) :
Remarques organisationnelles :
Contacts :
r.milano@hech.be