Programme des cours 2021-2022
ATGA3060-1  
Sciences appliquées à l'agronomie X, Biométrie appliquée
Durée :
45h Th
Nombre de crédits :
Bachelier en agronomie4
Nom du professeur :
Robert Milano
Langue(s) de l'unité d'enseignement :
Langue française
Organisation et évaluation :
Enseignement au premier quadrimestre, examen en janvier
Unités d'enseignement prérequises et corequises :
Les unités prérequises ou corequises sont présentées au sein de chaque programme
Contenus de l'unité d'enseignement :
Ce cours alterne des notions théoriques en statistiques et leur mise en pratique sur ordinateur.
Le volet pratique de ce cours (TP) poursuit et amplifie la maîtrise du logiciel R commencée l'an dernier, logiciel permettant de réaliser, entre autres, des analyses statistiques.
Dès lors, pour utiliser de façon cohérente, efficiente et sensée un tel logiciel, l'étudiant devra  -- conjointement à l'apprentissage des commandes de base du logiciel R -- étayer cette initiation des notions élémentaires de la statistique.
Ce cours a donc pour objectif une approche concrète des concepts statistiques les plus courantes, point de départ de toute analyse de données bio-agronomiques. Les chapitres suivants commenceront par approfondire ceux introduits l'an passé  pour ensuite aborder des notions nouvelles :
A. Statistiques descriptives
A.1. Variables discrètes, continues, quantitatives, qualitatives, ordinales, nominales.
A.2. Statistiques à une variable
*Moyenne, médiane, fréquences, étendue, variance, écart-type, quartiles, score Z, intervalle interquartile, valeurs extrêmes.
*Table des effectifs et des fréquences (pourcentages); Effectifs cumulés; Fréquences cumulées.
*Diagramme en bâtons; Diagramme circulaire; Histogramme; Box-plot; Q-Q-Plot; strip-chart, etc.
*Fonction de répartitions.

A.3. Statistiques à deux variables
A.3.1. - Deux variables qualitatives : tableau de contingence, diagramme en mosaïques, distributions marginales, probabilités conditionnelles.
A.3.2. - Une variable qualitative et une variable quantitative : statistiques groupées, Box-plot parallèles, événements rares ou aberrants. 
A.3.3. - Deux variables quantitatives : nuage de points, corrélation, régression linéaire, ajustement des moindres carrés, coefficient de détermination.
B. Lois de probabilités
B.1. - Rappels de notions de bases en probabilités : indépendance d'événements, incompatibilité, probabilité conditionnelle.
B.2. Notions de variable aléatoire, d'espérance d'une v.a., fonction de répartition, loi de probabilité d'une v.a.
B.3. Loi Binomiale
B.4. Loi Normale
B.5. Loi Khi-Carré
B.6. Loi de Student
C. Statistique inférentielle  :
C.1. Notion d'échantillonnage; notion d'estimateur.
C.2. Estimation ponctuelle d'une moyenne et d'une proportion.
C.3. Intervalle de confiance (IC) d'un estimateur (proportion, moyenne, etc.).
D. Tests d'hypothèses
D.1. risque alpha, bêta, niveau de confiance, puissance d'un test, test unilatéral, test bilatéral
D.2. Test du X² : test d'indépendance
D.3. Comparaison de deux moyennes (variance connue ou estimée) : Test de Student
D.4. Comparaison de deux moyennes issues de "gros" échantillons : hypothèse de normalité (-> Test de Shapiro)
D.5. Comparaison de deux proportions : Approximation normale - Test de Fisher - Test de Mc Nemar
D.6. Comparaison de plusieurs moyennes : ANOVA à 1 facteur / ANOVA à 2 facteurs (+ Diagrammes d'interaction)
D.7. Test de normalité d'une v.a. / Test d'homogénéité des variances (BARTLETT, LEVENE)
D.8. Tests non-paramétriques tels que : Mann-Whitney, Wilcoxon, Kruskal-Wallis, test exact de Fisher, test de Mc Nemar, Corrélation des rangs
 
E Analyse multivariée
Visualisation de bases de données multivariées / notions de bases : scatterplots globaux, diagrammes en étoiles, diagrammes en arborescence - dendrogrammes, régression multivariée.   
EXERCICES/TP
Les notes du cours théorique contiennent de nombreux exercices variés dont certains sont résolus en classe.
De plus, les étudiants reçoivent un document reprenant des exercices complémentaires. Une majorité de ces exercices renvoient à des bases de données mises à disposition des étudiants. Certains exercices sont résolus pendant les séances théoriques ou durant les séances pratiques sur ordinateur, d'autres sont proposés mais facultatifs. 
 
Acquis d'apprentissage (objectifs d'apprentissage) de l'unité d'enseignement :
- Connaître les méthodes de calcul de la statistique descriptive, de l'inférence statistique et des tests d'hypothèses.
- Etudes de cas pratiques. Appliquer ces méthodes à des cas concrets. A cet effet, des bases de données seront fournies aux étudiants sous format électronique.
- Discuter les avantages et inconvénients des ces méthodes. Justifier clairement la pertinence des méthodes choisies et leur condisitons de validité.
- Evaluer la cohérence des résultats et leur limitation.
- Pour l'étude de cas concrets sur ordinateur (à l'aide du logiciel R), l'étudiant choisira la méthode la plus appropriée selon la base de données. Ce choix devra être justifié. Il s'agira de montrer sa compréhension des concepts mis en pratique dans cette étude. L'étudiant justifiera ses méthodes d'analyse et commentera clairement les résultats obtenus par le logiciel R. Il fera preuve d'une approche critique sur la pertinence de sa démarche et des résultats.
Savoirs et compétences prérequis :
- Maîtrise de Windows (gestion des répertoires et des fichiers, etc.);
- Maîtrise du cours de mathématiques (Dérivation - Fonctions exponentielle et logarithmique - Intégration - Analyse combinatoire).
Activités d'apprentissage prévues et méthodes d'enseignement :
- Cours ex cathédra en présentiel.
- Des séances d'exercices avec le logiciel R sont prévues.
- Des bases de données seront fournies aux étudiants pour qu'ils puissent s'exercer durant les travaux pratiques. Des cas concrets seront analysés et étudiés sur ordinateur durant les séances de TP.
Remarque : les notes de cours ET les informations orales diffusées durant le cours et les traveaux pratiques sont matières d'examen.
Mode d'enseignement (présentiel, à distance, hybride) :
- Présentiel. Cours oral, patiellement sur PC (logiciel R).
- L'étudiant qui le désire peut installer le logiciel R sur son PC (logiciel gratuit) et travailler sur son propre ordinateur durant les TP.
REMARQUE. Les notes de cours et les informations livrées durant le cours oral sont matières d'examen.
Lectures recommandées ou obligatoires et notes de cours :
Des notes de cours seront transmises durant la progression du cours.
- Statistique Théorique et AppliquéeTome 1 , Pierre Dagnelie, De Boeck   (-> disponible à la bibliothèque de l'ISIa).
- Théorie et méthodes statistiques (Applications agronomiques)Tome 2, Pierre Dagnelie, De Boeck     (-> disponible à la bibliothèque de l'ISIa).
- Le Logiciel R, Pierre Lafaye de Michaux et al., Springer  (-> disponible à la bibliothèque de l'ISIa).
- Internet offre de nombreux documents introduisant au logiciel R. Par exemple : R pour débutants   ( -> transmis au cours).
- Biostatistique pour les sciences de la vie et de la santé, Mario Triola, Pearson Education
- Un site intéressant :  http://webapps.fundp.ac.be/biostats  -> apprentissage des Biostatistiques de la FUNDP (responsable académique : Eric Depiereux)
- Probabilités, analyse des données et Statistique, Gilbert Saporta, éditions TECHNIP  (-> disponible à la bibliothèque de l'ISIa)
- Méthodes statistiques en biologie et en agronomie, André Vessereau, Editeur : Tec&Doc;  2e édition (1999)   (-> disponible à la bibliothèque de l'ISIa)
- Initiation à la statistique avec R - 2e éd. - Cours, exemples, exercices et problèmes corrigés, Frédéric Bertrand, Myriam Maumy-Bertrand, Editeur : Dunod;  2e édition (2014)   (-> disponible à la bibliothèque de l'ISIa)
 
Modalités d'évaluation et critères :
Epreuve pratique sur ordinateur en présentiel.
Etude de cas concrets avec le logiciel R. L'étudiant choisira la méthode la plus appropriée pour l'étude d'une (ou plusieurs) base(s) de données. Ce choix devra être justifié.
L'étudiant montrera sa connaissance et sa compréhension des concepts mis en pratique dans son analyse. L'étudiant justifiera sa démarche et commentera clairement les résultats livrés par le logiciel R. Il fera preuve d'une approche critique sur la pertinence de sa démarche et des résultats.
La cote minimum de 10/20 doit être atteinte afin de réussir le cours (sauf décision contraire du jury de délibération).
Stage(s) :
Remarques organisationnelles :
Contacts :
r.milano@hech.be