Programme des cours 2023-2024
AGRO1014-1  
Biométrie
Durée :
30h Th
Nombre de crédits :
Master en sciences de l'ingénieur industriel en agronomie, orientation agronomie3
Master en sciences de l'ingénieur industriel en agronomie, orientation bio-industries3
Master en sciences de l'ingénieur industriel en agronomie, orientation environnement3
Nom du professeur :
Robert Milano
Langue(s) de l'unité d'enseignement :
Langue française
Organisation et évaluation :
Enseignement au deuxième quadrimestre
Unités d'enseignement prérequises et corequises :
Les unités prérequises ou corequises sont présentées au sein de chaque programme
Contenus de l'unité d'enseignement :
Ce cours est la suite du cours de statistiques abordé en deuxième master.

Il a pour objectif une approche concrète des notions statistiques les plus courantes, point de départ de toute analyse de données bio-agronomiques. Plus précisément, seront rappelées et approfondies les notions suivantes :

A. Statistiques descriptives : paramètres de tendance centrale et de dispersion. Quartiles.

    Visualisation des données : barplots, histogrammes, boxplots, mosaicplot, etc.

    Régression linéaire (droite des moindres carrés) et paramètre d'adéquation de cette approximation linéaire.

B. Intervalle de confiance (IC) d'un estimateur (proportion, moyenne, etc.).

C. Tests d'hypothèses

   C.1. risque alpha, bêta, niveau de confiance, puissance d'un test, test unilatéral, test bilatéral

   C.2. Test du X² : test d'indépendance

   C.3. Comparaison de deux moyennes (variance connue ou estimée) : Test de Student

   C.4. Comparaison de deux moyennes issues de "gros" échantillons : hypothèse de normalité

   C.5. Comparaison de deux proportions : Approximation normale - Test de Fisher - Test de Mc Nemar

   C.6. Comparaison de plusieurs moyennes : ANOVA à 1 facteur / ANOVA à 2 facteurs (+ Diagrammes d'interaction)

   C.7. Test de normalité d'une v.a. / Test d'homogénéité des variances (BARTLETT, LEVENE)

   C.8. Tests non-paramétriques tels que : Mann-Whitney, Wilcoxon, Kruskal-Wallis, test exact de Fisher, test de Mc Nemar, Corrélation des rangs



Suite à ces révisions et approfondissements relatifs aux analyses uni-variées et bi-variées, une introduction à l'analyse de données multi-variées fournira quelques outils de base pour visualiser et dégager des liens éventuels entre plusieurs variables :

D. Analyse multivariée : arborescence, arbre de décision, dendrogramme, clustering, analyse factorielle, analyse en composantes principales, régression linéaire multivariée, modèle linéaire généralisé, analyse des correspondances, analyse des correspondances multiples. Mise en graphique de données multi-variées.

E. Plans d'expérience : introduction (sensiblisation à cette problématique).

 

Logiciel "R" : FAIRE des statistiques nécessite l'usage d'un logiciel spécialisé pour produire graphiques et analyses. Le logiciel "R" retenu dans ce cours est à la fois performant et gratuit.

Ce cours fera continuement le lien entre les notions étudiées et leur mise en oeuvre en "R". Cette approche résolument pratique vise à illustrer la théorie et la rendre opérationnelle.


EXERCICES/TP

Les notes du cours théorique contiennent de nombreux exercices variés dont certains sont résolus en classe.

De plus, les étudiants reçoivent un document reprenant des exercices complémentaires de synthèse. Une majorité de ces exercices renvoient à des bases de données mises à disposition des étudiants. Certains exercices sont résolus pendant les séances théoriques ou durant les séances pratiques sur ordinateur, d'autres sont proposés à titre complémentaire. 

 
Acquis d'apprentissage (objectifs d'apprentissage) de l'unité d'enseignement :
- Connaître les méthodes de calcul de la statistique descriptive, de l'inférence statistique, des tests d'hypothèses et de l'analyse multivariée.
- Etudes de cas. Appliquer ces méthodes à des cas concrets. 
- Acquérir une autonomie de décision dans un cas concret de traitement de données.
- Justifier le choix des méthodes utilisées. Notamment, connaitre leurs conditions d'application.
- Discuter les avantages, inconvénients et la pertinence des tests choisis. 
- Evaluer la cohérence et l'intérêt des résultats. Expliciter la conclusion à en tirer.
- Utilisation de R.
Savoirs et compétences prérequis :
- Maîtrise de Windows et des commandes basiques d'un ordinateur (gestion des fichiers, etc.)

- Pré-requis mathématiques : Vecteurs. Matrices - Dérivée d'une fonction - Fonctions exponentielle et logarithmique  - Intégration - Analyse combinatoire
Activités d'apprentissage prévues et méthodes d'enseignement :
Résolution de problèmes statistiques et études de cas concrets.                                         
Exercices, applications : études et analyses de bases de données variées.

TP sur ordinateur avec le logiciel R. S'il le désire, l'étudiant pourra installer le logiciel R sur son propre PC.

Les informations livrées durant le cours sont tout aussi importantes que celles figurant sur les notes. Les notes ne résument pas toute l'information utile aux examens.

Des notes en format PDF sont mises à disposition des étudiants.

Au fur et à mesure de l'avancée dans ces notes de cours, l'étudiant mettra en pratique les notions abordées grâce au logiciel R.  La résolution des exercices se fera aussi avec R. Ceci favorisera une familiarisation progressive avec ce logiciel. 
Mode d'enseignement (présentiel, à distance, hybride) :
Présentiel.
La matière d'examen porte aussi bien sur les notes de cours (et les séance d'exercices) que les informations orales transmises durant les cours.
 
Lectures recommandées ou obligatoires et notes de cours :
- Des notes de cours au format PDF sont distribuées durant les cours.
- Statistique Théorique et Appliquée, Tome 1 , Pierre Dagnelie, De Boeck    (-> disponible à la bibliothèque de l'ISIa).
- Théorie et méthodes statistiques (Applications agronomiques)Tome 2, Pierre Dagnelie, De Boeck     (-> disponible à la bibliothèque de l'ISIa).
- Le Logiciel R, Pierre Lafaye de Michaux et al., Springer  (-> disponible à la bibliothèque de l'ISIa).
- Internet offre de nombreux documents introduisant au logiciel R. Par exemple : R pour débutants  ( -> transmis au cours).
- Biostatistique pour les sciences de la vie et de la santé, Marion Triola, Pearson Education
- Un site intéressant :  http://webapps.fundp.ac.be/biostats  -> Plate-forme d'auto-apprentissage des Biostatistiques de la FUNDP (responsable académique Eric Depiereux)
- Probabilités, analyse des données et Statistique, Gilbert Saporta, éditions TECHNIP  (-> disponible à la bibliothèque de l'ISIa)
- Méthodes statistiques en biologie et en agronomie, André Vessereau, Editeur : Tec&Doc;  2e édition (1999)   (-> disponible à la bibliothèque de l'ISIa)
- Initiation à la statistique avec R - 2e éd. - Cours, exemples, exercices et problèmes corrigés, Frédéric Bertrand, Myriam Maumy-Bertrand, Editeur : Dunod;  2e édition (2014)   (-> disponible à la bibliothèque de l'ISIa)
- Internet offre de nombreux documents introduisant au logiciel R.  Par exemple :  R pour débutants  (-> transmis au cours). 
Modalités d'évaluation et critères :
Examen écrit. Exercrices à résoudre à l'aide du logiciel R (analyse d'une ou plusieurs bases de données).
Stage(s) :
Remarques organisationnelles :
...
Contacts :
r.milano@hech.be