Programme des cours 2023-2024
ASCA2025-1  
Informatique appliquée à la statistique
Durée :
30h Th
Nombre de crédits :
Bachelier en sciences agronomiques2
Nom du professeur :
Robert Milano
Langue(s) de l'unité d'enseignement :
Langue française
Organisation et évaluation :
Enseignement au premier quadrimestre, examen en janvier
Unités d'enseignement prérequises et corequises :
Les unités prérequises ou corequises sont présentées au sein de chaque programme
Contenus de l'unité d'enseignement :
Ce cours est une initiation au logiciel R, logiciel permettant de réaliser des analyses statistiques.
Dès lors, pour utiliser de façon cohérente, efficiente et sensée un tel logiciel, l'étudiant devra  -- conjointement à l'apprentissage des commandes de base du logiciel R -- étayer cette initiation de notions élémentaires de la statistique.
Ce cours est donc le volet pratique du cours de statistiques, ayant pour objectif une approche concrète des notions statistiques les plus courantes, point de départ de toute analyse de données bio-agronomiques. Durant ces séances sur ordinateur, seront mis en pratique les chapitres suivants du cours :
A. Statistiques descriptives
A.1. - Variables discrètes, continues, quantitatives, qualitatives, ordinales, nominales.
A.2. - Statistiques à une variable
*Moyenne, médiane, fréquences, étendue, variance, écart-type, quartiles, score Z, intervalle interquartile, valeurs extrêmes.
*Table des effectifs et des fréquences (pourcentages); Effectifs cumulés; Fréquences cumulées.
*Diagramme en bâtons; Diagramme circulaire; Histogramme; Box-plot; Q-Q-Plot; strip-chart, etc.
*Fonction de répartitions.

A.3. Statistiques à deux variables
A.3.1. - Deux variables qualitatives : tableau de contingence, diagramme en mosaïques, distributions marginales, probabilités conditionnelles.
A.3.2. - Une variable qualitative et une variable quantitative : statistiques groupées, Box-plot parallèles, événements rares ou aberrants. 
A.3.3. - Deux variables quantitatives : nuage de points, corrélation, régression linéaire, ajustement des moindres carrés, coefficient de détermination.
B. Lois de probabilités
B.1. - Rappels de notions de bases en probabilités : indépendance d'événements, incompatibilité, probabilité conditionnelle.
B.2. Notions de variable aléatoire, d'espérance d'une v.a., fonction de répartition, loi de probabilité d'une v.a.
B.3. Loi Binomiale
B.4. Loi Normale
B.5. Loi Khi-Carré
B.6. Loi de Student
C. Statistique inférentielle  :
C.1. - Notion d'échantillonnage; notion d'estimateur.
C.2. - Estimation ponctuelle d'une moyenne et d'une proportion.
C.3. - Intervalle de confiance (IC) d'un estimateur (proportion, moyenne, etc.).
D. Tests d'hypothèses
D.1. Risque alpha, bêta, niveau de confiance, puissance d'un test, test unilatéral, test bilatéral
D.2. Test du X² : test d'indépendance
D.3. - Comparaison de deux moyennes (variance connue ou estimée) : Test de Student
D.4. - Comparaison de deux moyennes issues de "gros" échantillons : hypothèse de normalité
D.5. - Comparaison de deux proportions : Approximation normale - Test de Fisher - Test de Mc Nemar
D.6. - Comparaison de plusieurs moyennes : ANOVA à 1 facteur / ANOVA à 2 facteurs (+ diagrammes d'interaction)   D.7. - Test de normalité d'une v.a. / Test d'homogénéité des variances (BARTLETT, LEVENE)
D.8. - Tests non-paramètriques tels que : Mann-Whitney, Wilcoxon, Kruskal-Wallis, test exact de Fisher, test de Mc Nemar, Corrélation des rangs
 
EXERCICES/TP
Les notes du cours théorique contiennent des dizaines d'exercices variés dont certains sont résolus en classe. De plus, les étudiants reçoivent un document reprenant des dizaines d'énoncés. Une majorité de ces exercices renvoient à des bases de données mises à disposition des étudiants. Certains exercices sont résolus pendant les séances théoriques ou durant les séances pratiques sur ordinateur, d'autres sont proposés mais facultatifs. 
 
Acquis d'apprentissage (objectifs d'apprentissage) de l'unité d'enseignement :
- Connaître les méthodes de calcul de la statistique descriptive et de l'inférence statistique.

- Etudes de cas. Choisir la ou les méthode(s) pertinente(s) et appliquer ces méthodes à des cas concrets (TFE)

- Discuter les avantages, inconvénients et la pertinence des tests choisis

- Evaluer la pertinence des résultats

- Utiliser le logiciel R
Savoirs et compétences prérequis :
- Maîtrise de Windows (gestion des répertoires et des fichiers, etc.):
- Maîtrise du cours de mathématiques de base (Dérivation, fonctions exponentielles et logarithmiques, intégration, analyse combinatoire).
Activités d'apprentissage prévues et méthodes d'enseignement :
Des notes de cours sont mises à disposition des étudiants sous format PDF.
L'étudiant mettra en pratique les notions statistiques théoriques avec au logiciel R.  La résolution des exercices se fera aussi avec R. Ceci favorisera une familiarisation progressive avec ce logiciel.
REMARQUE : Les notes ET les informations orales livrées durant le cours sont matières d'examen.
Mode d'enseignement (présentiel, à distance, hybride) :
- Présentiel. Travaux pratiques sur PC
- L'étudiant qui le désire peut installer le logiciel R (logiciel gratuit) sur son PC et travailler sur son propre ordinateur durant les TP.
Lectures recommandées ou obligatoires et notes de cours :
- Les notes de cours (PDF) distribuées durant le cours contiennent de nombreux exemples de commandes R.
- Statistique Théorique et Appliquée, Tome 1, Pierre Dagnelie, De Boeck    (-> disponible à la bibliothèque de l'ISIa).
- Théorie et méthodes statistiques (Applications agronomiques), Tome 2, Pierre Dagnelie, De Boeck     (-> disponible à la bibliothèque de l'ISIa).
Biostatistique pour les sciences de la vie et de la santé, Mario Triola, Pearson Education
- Probabilités, analyse des données et Statistique, Gilbert Saporta, éditions TECHNIP   (-> disponible à la bibliothèque de l'ISIa)
- Méthodes statistiques en biologie et en agronomie, André Vessereau, Editeur : Tec&Doc;  2e édition (1999)   (-> disponible à la bibliothèque de l'ISIa)
- VAN VYVE-GENETTE et al. (1995) disponible sur la Plate forme d'auto-apprentissage des Biostatistiques de la FUNDP (responsable académique : Eric Depiereux, http://webapps.fundp.ac.be/biostats).
- Le Logiciel R, Pierre Lafaye de Michaux et al., Springer  (-> disponible à la bibliothèque de l'ISIa).
- Initiation à la statistique avec R - 2e éd. - Cours, exemples, exercices et problèmes corrigés, Frédéric Bertrand, Myriam Maumy-Bertrand, Editeur : Dunod;  2e édition (2014)   (-> disponible à la bibliothèque de l'ISIa)
- Internet offre de nombreux documents introduisant au logiciel R.  Par exemple :  R pour débutants  (-> transmis au cours). 
  Notes de cours Fournies sous format PDF durant les cours.
 
Modalités d'évaluation et critères :
Etude statistique de cas concrets sur ordinateur à l'aide du logiciel R.

Travail écrit à remettre.

Ce travail reprendra les conclusions de l'étude d'une base de données (choisie par l'étudiant). L'étudiant définira clairement ses objectifs et présentera par écrit son projet. Ce projet concret est obligatoirement effectué à l'aide du logiciel R. Les consignes précises relatives à ce travail seront remises à l'étudiant en temps utiles, précisant les aspects pratiques et méthodologiques du rapport final à remettre.

L'étudiant choisira la méthode la plus appropriée pour l'étude d'une base de données. L'étudiant devra justifier clairement et complètement la méthode choisie et commenter avec pertinence les codes R ainsi qu'expliquer les résultats obtenus. Il s'agira de montrer sa compréhension des concepts mis en pratique dans cette étude.

L'étudiant justifiera ses méthodes d'analyse et commentera clairement les résultats obtenus par le logiciel R. Il fera preuve d'une approche critique sur la pertinence de sa démarche et des résultats.

Pour les travaux contestables (suspicion de plagiat, par exemple), une défense orale du travail est prévue pour que l'étudiant puisse présenter sa méthodologie, argumenter ses résultats et répondre aux questions de l'enseignant.


Ce travail devra être finalisé et remis au plus tard le 8 janvier. La jour de l'examen (date officielle reprise dans l'horaire) sera éventuellement consacré à une défense orlale du travail => exclusivement pour les travaux les moins clairs ou les moins argumentés. Durant cet oral, l'étudiant devra justifier ses choix et méthodes et les relier aux notions théoriques vues aux cours (l'étudiant est donc censé connaître et maîtriser la matière du cours). La liste des étudiants retenus pour cette défense orals sera communiquée au plus tard cinq jours avant la date de l'examen.

 
Stage(s) :
Remarques organisationnelles :
Contacts :
r.milano@hech.be