Quartiles .Boîte à moustaches

 

    Compléments de la classe de seconde sur les STAT.      1S     Juin  2009

         Notation:  E( x ) est la partie entière du réel x.

                         E( x ) est le plus gand entier relatif inférieur ou égal à x.

                         Pour tout réel x on a :  E( x ) ≤ x  < E( x ) + 1

. I.  ATTENTION  LES CONVENTIONS VARIENT SELON LES STATISTICIENS

 POUR UNE SERIE STATISTIQUE QUANTITATIVE. ( Caractère quantitatif c-à-d numérique.)

         Soit la série:

Valeurs distinctes x1 ......   ......... xN'
Effectifs relatifs n1 ....... ........... nN' Σni = N

 Valeurs distinctes :   x1 ......   ......... xN'

Effectifs relatifs:      n1 ....... ........... nN'

 Effectif total :          Σni = n1 +  ................+  nN' =N 

             N est dans les entiers naturels non nuls.  N est l'effectif total.

         • Quartiles et Médiane.

               ( Convention .  Attention ce n'est pas la seule possible  )

        Attention ce n'est pas la seule possible.

          Méthode :  On écrit la liste des valeurs du caractère, dans l'ordre croissant, en répétant

          chacune d'elles autant de fois que son effectif.

                 --------------------------------------------------------------------------------------------------------------------------------

            • • Si N / 4 est dans IN* alors  Q1  est la valeur qui figure dans la liste à la ( N / 4 ) ième

                 place ,   Q3   est la valeur qui figure dans la liste à la 3N / 4 ième   . 

                 Me ( médiane )   est la valeur qui figure dans la liste à la ( N / 2) ième   place.

             Attention il arrive, dans ce cas, que Me soit considérée comme la moyenne arithmétique

             des ( N / 2 ) ième  et     ( ( N / 2 )+ 1 ) ième    valeurs,  comme il n'y a pas de terme milieu.

                         L'inconvénient est que Me  peut ne pas  être alors une valeur prise.

              Exemple:                      N = 12      N est divisible par 2 et par 4.         N / 4 = 3                     

Valeurs distinctes x1 x2  x3 x4 x5
Effectifs relatifs 2 3 4 2 1

                      3  ; 9 sont les rangs  de     Q1    ;      Q         respectivement .   

            x1   x1    x     x2   x2        x3   x3   xx3        x4   x4     x5 

                         Q1                   Me             Q      

             On peut dire que Me est la valeur de rang 6.

             Mais on pourrait dire aussi  Me = ( x3  + x3 ) / 2 = x3   

                     (  La moyenne des  6ième   et  7ième  valeurs. )  

                -----------------------------------------------------------------------------------------------------------------------------------------

          • •  Si N / 4 n'est pas  dans IN* alors  Q1  est la valeur qui figure dans la liste

                à la E( N / 4 ) + 1  ième   place ,    Q3   est la valeur qui figure dans la liste à 

                3×E( N / 4 ) + 1  ième   place .

                  Me ( médiane )   est la valeur qui figure  dans la liste à la  ( 2× E( N / 4 ) + 1 ) ième   place

               Attention  on peut dire aussi:

                   Si N est divisible par 2 alors on peut considérer que Me est  la moyenne arithmétique

                      des ( N / 2) ième   et     ( ( N / 2)+ 1 ) ième    valeurs comme il n'y a pas de terme milieu.

                   Si N n'est pas divisible par  2  alors on peut considérer que Me est la ( E( N / 2)+ 1 ) ième    valeurs )

               Exemple:                           N = 13      N n'est pas divisible par 4 ni par 2.     N / 4 = 3,25        N / 2 = 6,5                         

Valeurs distinctes x1 x2  x3 x4 x5
Effectifs relatifs 2 3 4 2 2

              E( N / 4 ) + 1 = 4       Donc Q1   est la  4ième    valeur.

               3 ×E( N / 4 ) + 1 = 10    Donc  Q   est la 10ième    valeur.

             x1   x1     x2  x  x2      x3   x   x3   x3    x4   x4   x5   x5 

                                 Q1              Me             Q     

               On peut prendre pour Me la  7ième   valeur   car    2× E( N / 4 ) + 1 = 7 

              On peut prendre aussi  pour Me  la  7ième   valeur  car    E( N / 2 ) + 1 = 7

--------------------------------------------------------------------------------------------------------  

              •  BOÎTE   A MOUSTACHE. 

                 C'est un schéma:

                  Q   et   Q3    limitent la boîte.

                   x  et  xn    limitent les moustaches

                  On utilise un axe  gradué pour y placer d'abord       x    ,    Q    ,     Q3   ,  xn     .   

            Q3   - Q    est l'écart interquartile.

          [  Q  ,  Q3 ]   est l'intervalle  interquartile.

                 • PROPRIETE;

                      Soit a et b deux réels. ( a non  nul )

                      Soit la série stat.

Valeurs distinctes x1 ......   ......... xN'
Effectifs relatifs n1 ....... ........... nN' Σni = N

                       Soit   yi  = a  xi + b      pour tout i compris entre 1 et n.     n dans IN*    .

                       Alors la série stat.

 

Valeurs distinctes y1 ......   ......... yN'
Effectifs relatifs n1 ....... ........... nN' Σni = N

                 admet les quartiles suivants:

                             a Q +b 

                             a Me   + b  

                             a Q3  + b 

------------------------------------------------------------------------------------------

       .II.    Notion de variance et d'écart type.

                     Soit la série quantitative :

Valeurs distinctes x1 ......   ......... xN'
Effectifs relatifs n1 ....... ........... nN' Σni = N

                                     (  N étant un entier naturel non nul.)

                         La moyenne est :

                                     m =  ( Σ ni x ) / Σni

                          La variance est :

                                 v = Σ ni  ( x )² / Σni    -   m²   ou encore

                                 v = ( Σ ni ( xi - m  )²  ) / Σn

                           L'écart type est :    σ = √ ( v )

                  L'écart type sert à valider ou invalider l'intérêt de la moyenne m.

                  c'est un paramètre de " dispersion"