Statistiques

Utilisation du tableur 
 

Intoduction

Statistiques
  Utilisation du tableur

Probabilités
  Lancer d'un dé (tableur)
  Lancer de deux dés (tableur)
  Lancer d'une pièce (petit nombre)
  Lancer d'une pièce (grand nombre)
  Lancer d'une pièce (avec graphique)
  Lancer d'un dé (applet java)
  Lancer de deux dés (applet java)
  Lancer de deux dés avec graphique (applet java)
 
 
Comment préparer des TD portant sur les statistiques pour que les élèves utilisent un tableur sans que les feuilles de calculs et les formules ne deviennent trop compliquées ? Et dans ce cadre, comment introduire les caractéristiques de position et de dispersion d'une série en regroupant les valeurs en classes ?

Téléchargement
Quelques propositions
Préparer à l'avance un classeur pour les élèves avec la présentation déjà faite (ce qui fait gagner du temps).

1er niveau
Téléchargement du fichier Excel (Stat1.xls, 53 ko), du fichier Calc (Stat1.ods, 15 ko)
Pour regrouper les valeurs d’une série statistique en classes et étudier un certain nombre de caractéristiques, le classeur suivant suffit :
Il contient une feuille principale de travail (TD1) et 3 autres feuilles qui permettent aux élèves de travailler avec des valeurs différentes de la série (il suffit de copier les données dans la feuille de travail). On peut demander aux élèves de nommer la zone des valeurs de la série en "Taille" (par le menu Insertion puis la commande Nom, Définir) ce qui simplifie grandement la saisie de formules
On peut ensuite demander de :
  • Calculer l'amplitude de la série en utilisant en haut de la feuille les fonctions MIN et MAX
  • Calculer la moyenne, la médiane, le premier et troisième quartile de la série en utilisant les fonctions MOYENNE, MEDIANE et QUARTILE. Ces fonctions portent sur l'ensemble de la série, la fonction QUARTILE possède un deuxième paramètre qui détermine le quartile (1 à 4).
  • Définir, par exemple, 5 classes et mettre les bornes dans les cellules D6 à D10
  • D'utiliser la fonction NB.SI. Par exemple, la formule : =NB.SI(Taille;">=150"), renvoie le nombre de valeur de la série supérieur ou égale à 150. Facile d'imaginer ce que renverra la formule : =NB.SI(Taille;">=160"). On peut donc calculer les effectifs automatiquement à partir de la série "Taille". Par exemple, dans la cellule E6, pour la classe [150; 160[, il suffit d'entrer la formule : =NB.SI(Taille;">=150")-NB.SI(Taille;">=160").
  • Cette formule peut être recopiée vers le bas mais il faudra changer à la main les valeurs des conditions avec les bornes respectives des intervalles (cette contrainte est supprimée dans le niveau 2 ci-dessous au prix d'une présentation un peu plus compliquée).
  • Utiliser la fonction SOMME pour calculer l'effectif total dans la cellule E12.
  • Les formules pour trouver les effectifs cumulés ainsi que les fréquences et fréquences cumulées ne posent pas de problème (attention toutefois l'effectif total devra être utilisé dans les formules avec les références absolues de la cellule E12 : c'est absolument nécessaire avant la recopie vers le bas de ces formules).
  • Faire l'histogramme des effectifs en sélectionnant les cellules des classes et des effectifs.

On peut ainsi faire relever et étudier les caractéristiques de dispersion en relation avec le graphique pour les 3 populations en copiant les données des autres feuilles dans la zone correspondante ou en utilisant une feuille (contenant une macro, le niveau de sécurité doit être réglé) générant aléatoirement une population (Excel : Population.xls ou Calc : Population.ods)

Remarques :
1) Pour calculer la moyenne "pondérée" avec les classes, il est nécessaire d'introduire une colonne supplémentaire pour afficher le centre des classes.
2) Avec Excel ou Calc d'OpenOffice, on peut modifier le graphique pour qu’il ressemble à un histogramme (les classes ont la même amplitude), il faut élargir les barres (car en réalité le graphique initial est un diagramme en barres) par l’option Format de la série de données du menu contextuel obtenu en cliquant avec le bouton droit de la souris après avoir sélectionné les barres.
Dans la boîte de dialogue obtenue, prendre l’onglet Options et réduire la largeur de l’intervalle à 0.

On obtient alors l’histogramme ci-dessus. Il reste à modifier les abscisses. Le graphique étant sélectionné, on peut dessiner (avec les outils de dessin) un bloc de texte sur la légende actuelle avec une couleur de fond automatique et écrire les bornes des classes.


2e niveau
Téléchargement du fichier Excel (Stat2.xls, 72 ko), du fichier Calc (Stat2.ods, 15 ko)
Le début du tableau est fait de manière à pouvoir utiliser les bornes des intervalles comme des nombres (elles sont dans des cellules séparées) :
Mais les bordures sont cachées pour donner l'illusion d'une seule cellule.
Pour calculer les effectifs des classes :
L'argument de la fonction NB.Si doit être du texte mais, avec les versions récentes (à partir d'Excel 97), la conversion du contenu d'une cellule en texte est automatique.
La formule à utiliser (voir niveau 1) : =NB.SI(Taille;">=150")-NB.SI(Taille;">=160") devient donc (en supposant que les cellules E6 et G6 contiennent respectivement 150 et 160) :
NB.SI(Taille;">="&E6)-NB.SI(Taille;">="&G6)
Cette formule a l'avantage de pouvoir être recopiée vers le bas sans modification.

Remarque : la partie de la formule : ">="&E6 concatène (opérateur &) la chaîne ">=" avec la valeur de la cellule E6 transformée en texte, ce qui donne au final la chaîne ">=150".

Au collège, les élèves pourront ensuite :
- Déterminer la médiane graphiquement en utilisant comme données les bornes des intervalles et la colonne des fréquences cumulées (attention les pourcentages doivent commencer à 0% pour la plus petite borne, il peut être nécessaire d’ajouter une ligne ou une colonne au tableau !).
- Utiliser la fonction SOMME pour calculer l’effectif total, N.
- Calculer la somme des produits du centre de chaque classe par son effectif en utilisant la fonction SOMMEPROD puis la moyenne pondérée en divisant cette somme par l'effectif total.

Au lycée
Les tableurs comme Excel ou Calc d'OpenOffice possèdent les fonctions pour calculer la variance ou l’écart type d’une série mais à partir de la série entière (VAR.P, ECARTYPEP) ou sur un échantillon de la population. On peut aussi faire un calcul approché (que l’on comparera à celui obtenu avec la fonction du tableur) à partir des classes mais il faut le faire soit même (bon entraînement pour les élèves pour maîtriser les formules…)
Les élèves pourront donc :
- Calculer la variance et l’écart type avec la formule vue en cours en ajoutant une colonne à la fin du tableau :
xi représente le centre d'une classe et m la moyenne pondérée.
Note : La variance est alors calculée par 1/N ?ni(xi-m)2 où N est l'effectif total et ni l'effectif de la classe i. Pour calculer la somme des produits ni(xi-m)2, on utilise de nouveau la fonction SOMMEPROD avec, comme argument, la colonne des effectifs ni et la colonne des (xi-m)2. Il suffit de diviser cette somme par l'effectif total N pour avoir la Variance. Il n’y a plus qu’à utiliser la fonction RACINE pour calculer l'écart type.
On pourra utilement comparer avec les fonctions du tableur (VAR.P et ECARTYPEP).

 
© CNDP - Statistiques et probabilités
Février 2009 - Tous droits réservés. Limitation à l'usage non commercial, privé ou scolaire.