Le logiciel permet au sujet de faire deux séries de trente apparitions. Si bien qu'à l'issue de cette expérience, le sujet a à sa disposition deux séries de trente nombres.
A partir de ces données, beaucoup de questions mathématiques peuvent être posées, qui, chacune, mobilise des concepts statistiques différents :
Les résultats produits ci-dessous sont tous sortis des données réalisées par les élèves.
L'observation des données brutes (Voir figure data1) n'est que difficilement possible sans outil de représentation. Dès qu'elles sont représentées, on voit apparaître des lignes horizontales qui montrent bien le caractère discret des données (Figure data2). Ce phénomène dépend tout simplement du mode de fonctionnement de l'ordinateur qui scrute les actions des périphériques dans des intervalles de temps réguliers (interruptions). La représentation graphique des données brutes permet de faire émerger ce phénomène qui bien sûr ne pouvait être perçu dans le tableau data1. Dans une première approximation, on peut également sur cette représentation donner un intervalle dans lequel un fort pourcentage de la population va se trouver. Il y a une saturation des points entre environ 0,2 et 0,6. Un traitement de calcul permet d'ailleurs d'affiner cet intervalle et de montrer que 90% de la population appartient à l'intervalle [0,250;0,608].
La sensibilité de la moyenne aux valeurs extrêmes est particulièrement bien illustrée par la présence de quelques valeurs 100 dans les séries. Comme on peut le voir dans la table data5, les valeurs de la moyenne et de l'écart-type sont très affectées par les 7 valeurs 100 sur 839 valeurs alors que les quartiles ne le sont pas ou très peu.
La figure data3 donne les moyennes, médianes, quartiles, extrema pour chacune des séries de mesure. La fluctuation d'échantillonnage permet de comprendre que tous les paramètres bougent d'une série de mesures à une autre. La variation des moyennes, cependant est moindre que la variation des données. Comme précisé plus haut 90% des données appartient à l'intervalle [0,250;0,608] alors que 90% des moyennes appartiennent à l'intervalle [0,321;0,488] ce qui est une illustration de la loi faible des grands nombres.
|
La figure data4 représente les moyennes des vingt six séries avec leurs barres d'erreur au niveau 0,95 qui ont été calculées en utilisant l'intervalle :
On peut attendre que les élèves considèrent la moyenne comme la première caractéristique de description de leurs séries de données, et la pénalité de 100 secondes donnée pour une réaction anticipée doit amener une réflexion sur la possibilité de considérer d'autres caractéristiques.
Gilles 2012-03-05