Programme des cours 2022-2023
AGRO1014-1  
Sciences fondamentales et appliquées IV, Biométrie
Durée :
30h Th
Nombre de crédits :
Master en sciences de l'ingénieur industriel en agronomie, orientation agronomie3
Master en sciences de l'ingénieur industriel en agronomie, orientation bio-industries3
Master en sciences de l'ingénieur industriel en agronomie, orientation environnement3
Nom du professeur :
Robert Milano
Langue(s) de l'unité d'enseignement :
Langue française
Organisation et évaluation :
Enseignement au deuxième quadrimestre
Unités d'enseignement prérequises et corequises :
Les unités prérequises ou corequises sont présentées au sein de chaque programme
Contenus de l'unité d'enseignement :
Ce cours est la suite du cours de statistiques abordé en deuxième master.

Il a pour objectif une approche concrète des notions statistiques les plus courantes, point de départ de toute analyse de données bio-agronomiques. Plus précisément, seront étudiés les chapitres suivants :

A. Statistiques descriptives : paramètres de tendance centrale et de dispersion. Quartiles.

    Visualisation des données : barplots, histogrammes, boxplots, mosaicplot, etc.

    Régression linéaire (droite des moindres carrés) et paramètre d'adéquation de cette approximation linéaire.

B. Intervalle de confiance (IC) d'un estimateur (proportion, moyenne, etc.).

C. Tests d'hypothèses

   C.1. risque alpha, bêta, niveau de confiance, puissance d'un test, test unilatéral, test bilatéral

   C.2. Test du X² : test d'indépendance

   C.3. Comparaison de deux moyennes (variance connue ou estimée) : Test de Student

   C.4. Comparaison de deux moyennes issues de "gros" échantillons : hypothèse de normalité

   C.5. Comparaison de deux proportions : Approximation normale - Test de Fisher - Test de Mc Nemar

   C.6. Comparaison de plusieurs moyennes : ANOVA à 1 facteur / ANOVA à 2 facteurs (+ Diagrammes d'interaction)

   C.7. Test de normalité d'une v.a. / Test d'homogénéité des variances (BARTLETT, LEVENE)

   C.8. Tests non-paramétriques tels que : Mann-Whitney, Wilcoxon, Kruskal-Wallis, test exact de Fisher, test de Mc Nemar, Corrélation des rangs

D. Analyse multivariée : arborescence, arbre de décision, dendrogramme, clustering, analyse factorielle, analyse en composantes principales, régression linéaire multivariée, modèle linéaire généralisé, analyse des correspondances, analyse des correspondances multiples.

E. Plans d'expérience : introduction (sensiblisation à cette problématique).

 

Logiciel "R" : FAIRE des statistiques nécessite l'usage d'un logiciel spécialisé pour produire graphiques et analyses. Le logiciel "R" retenu dans ce cours est à la fois performant et gratuit.

Ce cours fera continuement le lien entre les notions étudiées et leur mise en oeuvre en "R". Cette approche résolument pratique vise à illustrer la théorie et la rendre opérationnelle.


EXERCICES/TP

Les notes du cours théorique contiennent de nombreux exercices variés dont certains sont résolus en classe.

De plus, les étudiants reçoivent un document reprenant des exercices complémentaires de synthèse. Une majorité de ces exercices renvoient à des bases de données mises à disposition des étudiants. Certains exercices sont résolus pendant les séances théoriques ou durant les séances pratiques sur ordinateur, d'autres sont proposés à titre complémentaire. 

 
Acquis d'apprentissage (objectifs d'apprentissage) de l'unité d'enseignement :
- Connaître les méthodes de calcul de la statistique descriptive, de l'inférence statistique, des tests d'hypothèses et de l'analyse multivariée.
- Etudes de cas. Appliquer ces méthodes à des cas concrets. 
- Acquérir une autonomie de décision dans un cas concret de traitement de données.
- Justifier le choix des méthodes utilisées. Notamment, connaitre leurs conditions d'application.
- Discuter les avantages, inconvénients et la pertinence des tests choisis. 
- Evaluer la cohérence et l'intérêt des résultats. Expliciter la conclusion à en tirer.
- Utilisation de R.
Savoirs et compétences prérequis :
- Maîtrise de Windows et des commandes basiques d'un ordinateur (gestion des fichiers, etc.)
- Pré-requis mathématiques : Vecteurs. Matrices - Dérivée d'une fonction - Fonctions exponentielle et logarithmique  - Intégration - Analyse combinatoire
Activités d'apprentissage prévues et méthodes d'enseignement :
Cours ex cathedra en présentiel
Résolution de problèmes statistiques et études de cas concrets.                                          Exercices, applications : études et analyses de bases de données variées.
TP sur ordinateur avec le logiciel R. S'il le désire, l'étudiant pourra installer le logiciel R sur son propre PC.
Les informations livrées durant le cours sont tout aussi importantes que celles figurant sur les notes. Les notes ne résument pas toute l'information utile aux examens.
Des notes en format PDF sont mises à disposition des étudiants.
Au fur et à mesure de l'avancée dans ces notes de cours, l'étudiant mettra en pratique les notions abordées grâce au logiciel R.  La résolution des exercices se fera aussi avec R. Ceci favorisera une familiarisation progressive avec ce logiciel. 
Mode d'enseignement (présentiel, à distance, hybride) :
Présentiel.
La matière d'examen porte aussi bien sur les notes de cours (et les séance d'exercices) que les informations orales transmises durant les cours.
 
Lectures recommandées ou obligatoires et notes de cours :
- Des notes de cours au format PDF sont distribuées durant les cours.
- Statistique Théorique et Appliquée, Tome 1 , Pierre Dagnelie, De Boeck    (-> disponible à la bibliothèque de l'ISIa).
- Théorie et méthodes statistiques (Applications agronomiques)Tome 2, Pierre Dagnelie, De Boeck     (-> disponible à la bibliothèque de l'ISIa).
- Le Logiciel R, Pierre Lafaye de Michaux et al., Springer  (-> disponible à la bibliothèque de l'ISIa).
- Internet offre de nombreux documents introduisant au logiciel R. Par exemple : R pour débutants  ( -> transmis au cours).
- Biostatistique pour les sciences de la vie et de la santé, Marion Triola, Pearson Education
- Un site intéressant :  http://webapps.fundp.ac.be/biostats  -> Plate-forme d'auto-apprentissage des Biostatistiques de la FUNDP (responsable académique Eric Depiereux)
- Probabilités, analyse des données et Statistique, Gilbert Saporta, éditions TECHNIP  (-> disponible à la bibliothèque de l'ISIa)
- Méthodes statistiques en biologie et en agronomie, André Vessereau, Editeur : Tec&Doc;  2e édition (1999)   (-> disponible à la bibliothèque de l'ISIa)
- Initiation à la statistique avec R - 2e éd. - Cours, exemples, exercices et problèmes corrigés, Frédéric Bertrand, Myriam Maumy-Bertrand, Editeur : Dunod;  2e édition (2014)   (-> disponible à la bibliothèque de l'ISIa)
- Internet offre de nombreux documents introduisant au logiciel R.  Par exemple :  R pour débutants  (-> transmis au cours). 
Modalités d'évaluation et critères :
Travail écrit à remettre. Il s'agira d'une étude d'un cas concret effectuée à l'aide du logiciel R.
Les consignes relatives à ce travail seront transmises en temps utiles. L'étudiant devra justifier clairement et complètement la méthode choisie et commenter avec pertinence ses codes "R" ainsi qu'expliquer les résultats obtenus.
Ce travail devra être finalisé et remis au moins six jours avant la date prévue pour l'examen de ce cours (se référer à l'horaire des examens). La jour de l'examen (date officielle reprise dans l'horaire) sera consacré à une défense orale du travail exclusivement pour les travaux les moins clairs ou les moins argumentés. Durant cet oral, l'étudiant devra justifier ses choix et méthodes et les relier aux notions vues aux cours (l'étudiant est donc censé connaître et maîtriser la matière du cours, cours auquel il aura accès durant l'examen). La liste des étudiants retenus pour cette défense orals sera communiquée deux jours avant la date de l'examen.
La cote minimum de 10/20 doit être atteinte afin de réussir le cours.
Stage(s) :
Remarques organisationnelles :
Dans l'éventualité d'un enseignement en "code rouge" (COVID-19), c'est-à-dire à distance, l'étudiant devra installer le logiciel "R" (et "RStudio") sur son PC personnel, les PC de la HECH n'étant alors pas forcément accessibles. Si un étudiant rencontre une difficulté dans l'acquisition ou l'utilisation d'un ordinateur, il doit le signaler le plus rapidement possible.
Contacts :
r.milano@hech.be