Programme des cours 2020-2021
ATTENTION : version 2019-2020 de l'engagement pédagogique
AGRO1014-1  
Sciences fondamentales et appliquées IV, Biométrie
Durée :
30h Th
Nombre de crédits :
Master en sciences de l'ingénieur industriel en agronomie, orientation agronomie3
Master en sciences de l'ingénieur industriel en agronomie, orientation bio-industries3
Master en sciences de l'ingénieur industriel en agronomie, orientation environnement3
Nom du professeur :
Robert Milano
Langue(s) de l'unité d'enseignement :
Langue française
Organisation et évaluation :
Enseignement au deuxième quadrimestre
Unités d'enseignement prérequises et corequises :
Les unités prérequises ou corequises sont présentées au sein de chaque programme
Contenus de l'unité d'enseignement :
Ce cours a pour objectif une approche concrète des notions statistiques les plus courantes, point de départ de toute analyse de données bio-agronomiques. Plus précisément, seront étudiés les chapitres suivants :

A. Statistiques descriptives
A.1. Variables discrètes, continues, quantitatives, qualitatives, ordinales, nominales.
A.2. Statistiques à une variable
*Moyenne, médiane, fréquences, étendue, variance, écart-type, quartiles, score Z, intervalle interquartile, valeurs extrêmes.
*Table des effectifs et des fréquences (pourcentages); Effectifs cumulés; Fréquences cumulées.
*Diagramme en bâtons; Diagramme circulaire; Histogramme; Box-plot; Q-Q-Plot; strip-chart, etc.
*Fonction de répartitions.

A.3. Statistiques à deux variables
A.3.1. - Deux variables qualitatives : tableau de contingence, diagramme en mosaïques, distributions marginales, probabilités conditionnelles.
A.3.2. - Une variable qualitative et une variable quantitative : statistiques groupées, Box-plot parallèles, événements rares ou aberrants. 
A.3.3. - Deux variables quantitatives : nuage de points, corrélation, régression linéaire, ajustement des moindres carrés, coefficient de détermination.
B. Lois de probabilités
B.1. - Rappels de notions de bases en probabilités : indépendance d'événements, incompatibilité, probabilité conditionnelle.
B.2. Notions de variable aléatoire, d'espérance d'une v.a., fonction de répartition, loi de probabilité d'une v.a.
B.3. Loi Binomiale
B.4. Loi Normale
B.5. Loi Khi-Carré
B.6. Loi de Student
C. Statistique inférentielle  :
C.1. Notion d'échantillonnage; notion d'estimateur.
C.2. Estimation ponctuelle d'une moyenne et d'une proportion.
C.3. Intervalle de confiance (IC) d'un estimateur (proportion, moyenne, etc.).
D. Tests d'hypothèses
D.1. risque alpha, bêta, niveau de confiance, puissance d'un test, test unilatéral, test bilatéral
D.2. Test du X² : test d'indépendance
D.3. Comparaison de deux moyennes (variance connue ou estimée) : Test de Student
D.4. Comparaison de deux moyennes issues de "gros" échantillons : hypothèse de normalité
D.5. Comparaison de deux proportions : Approximation normale - Test de Fisher - Test de Mc Nemar
D.6. Comparaison de plusieurs moyennes : ANOVA à 1 facteur / ANOVA à 2 facteurs (+ Diagrammes d'interaction)
D.7. Test de normalité d'une v.a. / Test d'homogénéité des variances (BARTLETT, LEVENE)
D.8. Tests non-paramétriques tels que : Mann-Whitney, Wilcoxon, Kruskal-Wallis, test exact de Fisher, test de Mc Nemar, Corrélation des rangs
E. Analyse multivariée : premières notions (arborescence, arbre de décision, dendrogramme, clustering, analyse factorielle).
 
EXERCICES/TP
Les notes du cours théorique contiennent de nombreux exercices variés dont certains sont résolus en classe. De plus, les étudiants reçoivent un document reprenant des exercices complémentaires de synthèse. Une majorité de ces exercices renvoient à des bases de données mises à disposition des étudiants. Certains exercices sont résolus pendant les séances théoriques ou durant les séances pratiques sur ordinateur, d'autres sont proposés mais facultatifs. 
 
Acquis d'apprentissage (objectifs d'apprentissage) de l'unité d'enseignement :
- Connaître les méthodes de calcul de la statistique descriptive, de l'inférence statistique, des tests d'hypothèses et de l'analyse multivariée.
- Etudes de cas. Appliquer ces méthodes à des cas concrets. 
- Acquérir une autonomie de décision dans un cas concret de traitement de données.
- Justifier le choix des méthodes utilisées. Notamment, connaitre leurs conditions d'application.
- Discuter les avantages, inconvénients et la pertinence des tests choisis. 
- Evaluer la cohérence et l'intérêt des résultats. Expliciter la conclusion à en tirer.
- Utilisation de R.
Savoirs et compétences prérequis :
- Maîtrise de Windows et des commandes basiques d'un ordinateur (gestion des fichiers, etc.)
- Pré-requis mathématiques : Vecteurs. Matrices - Dérivée d'une fonction - Fonctions exponentielle et logarithmique  - Intégration - Analyse combinatoire
Activités d'apprentissage prévues et méthodes d'enseignement :
Des notes en format PDF sont mises à disposition des étudiants.
Au fur et à mesure de l'avancée dans ces notes de cours, l'étudiant mettra en pratique les notions abordées grâce au logiciel R.  La résolution des exercices se fera aussi avec R. Ceci favorisera une familiarisation progressive avec ce logiciel. 
Mode d'enseignement (présentiel, à distance, hybride) :
Présentiel.
La matière d'examen porte aussi bien sur les notes de cours (et les séance d'exercices) que les informations orales transmises durant les cours.
 
Lectures recommandées ou obligatoires et notes de cours :
- Des notes de cours au format PDF sont distribuées durant les cours.
- Statistique Théorique et Appliquée, Tome 1 , Pierre Dagnelie, De Boeck    (-> disponible à la bibliothèque de l'ISIa).
- Théorie et méthodes statistiques (Applications agronomiques)Tome 2, Pierre Dagnelie, De Boeck     (-> disponible à la bibliothèque de l'ISIa).
- Le Logiciel R, Pierre Lafaye de Michaux et al., Springer  (-> disponible à la bibliothèque de l'ISIa).
- Internet offre de nombreux documents introduisant au logiciel R. Par exemple : R pour débutants  ( -> transmis au cours).
- Biostatistique pour les sciences de la vie et de la santé, Marion Triola, Pearson Education
- Un site intéressant :  http://webapps.fundp.ac.be/biostats  -> Plate-forme d'auto-apprentissage des Biostatistiques de la FUNDP (responsable académique Eric Depiereux)
- Probabilités, analyse des données et Statistique, Gilbert Saporta, éditions TECHNIP  (-> disponible à la bibliothèque de l'ISIa)
- Méthodes statistiques en biologie et en agronomie, André Vessereau, Editeur : Tec&Doc;  2e édition (1999)   (-> disponible à la bibliothèque de l'ISIa)
- Initiation à la statistique avec R - 2e éd. - Cours, exemples, exercices et problèmes corrigés, Frédéric Bertrand, Myriam Maumy-Bertrand, Editeur : Dunod;  2e édition (2014)   (-> disponible à la bibliothèque de l'ISIa)
- Internet offre de nombreux documents introduisant au logiciel R.  Par exemple :  R pour débutants  (-> transmis au cours). 
Modalités d'évaluation et critères :
Conformément à la circulaire de rentrée académique 2020-2021, un code couleur a été établi pour l'enseignement supérieur dans le cadre de la lutte contre le coronavirus. Les engagements pédagogiques ont été rédigés sur base du code « jaune ».
Examen pratique sur PC. Seront testés la connaissance des concepts abordés durant le cours et la compréhension des notions étudiées. 
L'étudiant justifiera clairement et complètement ses choix et ses méthodes d'analyse et commentera les résultats obtenus. Il fera preuve d'une approche critique sur la pertinence de sa démarche et des résultats.
La cote minimum de 10/20 doit être atteinte afin de réussir le cours.
Stage(s) :
Remarques organisationnelles :
Contacts :
r.milano@hech.be