INFORMATIONS DE COURS BTS AJUSTEMENT LINEAIRE. Lundi 15 sept.08
Deux méthodes sont à connaître:
La méthode de MAYER et la méthode des Moindres Carrés.
1. METHODE DES MOINDRES CARRES.
On dispose d'une série statistique double quantitative: ( x1 , y1) , ..... ( (xn , yn ).
On considère le nuage de n points M1( x1 , y1) , .............., Mn( xn , yn ).
( n entier naturel non nul.)
On veut si l'on représente les points du nuage dans un repère orthonormal trouver une droite
Δ: y = a x + b qui passe le plus près possible des points du nuage.
( A condition que la forme du nuage le permette.)
a. Justification des formules utilisées pour la droite de régression de y en x.
On considère, pour cela les points de la droite Δ,
A1( x1 , a x1+ b) , ... , A( xn , a xn+b ) .
On veut trouver a et b de façon que la somme des carrés des distances
A1M1 , .......,AnMn soit la plus petite possible.
Les segments [A1M1 ] , ................. , [AnMn ] sont paralèlles à l'axe des ordonnées.
On considère donc : g( b ) = (A1M1)2 + ........... ..........+ ( AnMn )2 = f ( a )
• On dérive la fonction g de variable b . On cherche pour quelle valeur de b
g' (b ) = 0 .
g ( b ) = ∑1i=n ( ( yi - a xi )- b )2 = ∑1i=n ( ( yi - a xi ) 2 + b2 - 2 b ( yi - a xi ) )
Alors:
g' ( b ) = ∑1i=n ( 2 b - 2 ( yi - a xi )) = 2 ∑1i=n ( b - ( yi - a xi ))
g' ( b ) = 2 ( n b - ( ∑1i=n yi )+ a ( ∑1i=n xi ) )
g' ( b ) = 0 ssi n b = ( ∑1i=n yi ) - a ( ∑1i=n xi )
g' ( b ) = 0 ssi b = ¯y - a ¯x ( 1 )
Donc le point moyen G ( ¯x , ¯y ) vérifie l'équation de Δ: y = a x + b.
L'équation de Δ est donc : y - ¯y = a ( x - ¯x ).
• Par ailleurs on a : f(a ) = ( y1 - ( a x1 + b ) )2 + .................. + ( yn - ( a xn + b ) )2
f( a) = ∑1i=n ( yi - ( a xi + b ) )2 = ∑1i=n ( yi - b- a xi )2
f( a) = ∑1i=n ( yi - ( y‾ - a x‾ )- a xi )2 En remplaçant b d'après ( 1 )
f( a) = ∑1i=n ( ( yi - y‾ ) + a ( x‾ - xi ) )2
f( a) = ∑1i=n ( ( yi - y‾ )2 + a2 ( x‾ - xi )2 + 2 a ( yi - y‾ )( x‾ - xi ) )
f(a) = ( ∑1i=n ( yi - y‾ )2 ) + a2 ( ∑1i=n ( x‾ - xi )2 ) - 2 a ( ∑1i=n ( yi - y‾ )( xi - x‾ ) )
f ' (a) = 2 a ∑1i=n ( x‾ - xi )2 ) - 2 ( ∑1i=n ( yi - y‾ )( xi - x‾ ) )
f ' ( a) = 2 [ a ( ∑1i=n ( xi - x‾ i )2 ) - ∑1i=n ( yi - y‾ )( xi - x‾ ) ]
Anisi f ' ( a ) = 0 ssi a ( ∑1i=n ( xi - x‾ )2 ) - ∑1i=n ( yi - y‾ )(xi - x‾ ) = 0
f ' ( a ) = 0 ssi a = ( ∑1i=n ( yi - y‾ )( xi -x‾ ) ) / ∑1i=n ( xi - x‾ )2
f ' ( a ) = 0 ssi a = ( ∑1i=n ( yi - y‾ )( xi - x‾ ) ) / ∑1i=n ( xi - x‾ )2
En divisant par n le numérateur et le dénominateur il vient :
f '(a ) = 0 ssi a = cov( x , y ) / v(x) avec cov( x , y ) =( ∑1i=n ( yi - y‾ )( xi - x‾ ) ) / n
et v(x) = ( ∑1i=n ( xi - x‾ )2 ) /n
( f ( a ) est minimale pour cette valeur de a . )
f y admet alors un extrémum qui est un minimum.)
Conclusion:
et b = y‾ - a ¯x
2. PROPRIETE.
y = a x + b avec a = cov( x , y ) / v(x) = cov( x , y ) / ( σ(x) )²
Avec les mêmes hypothèses:
cov( x , y ) = ( ∑1i=n ( yi - y‾ )( xi - x‾ ) ) / n v(x) =( ∑1i=n ( xi - x‾ )2 ) / n
cov( x , y ) = ( ∑1i=n ( xi yi - x‾ y‾ ) ) / n = ( ∑1i=n xi yi ) /n - x‾ y‾
( Obtenue en développant la formule de cov ( x , y ) .
3. DEFINITION.
Le coefficient de corrélation est : r = cov( x , y ) / ( σ(x) σ( y ) )
- 1 < r < 1.
Plus la valeur absolue de r est proche de 1 plus la corrélation est bonne .
a et rsont de même signe.
4. Remarque. Dans les épreuves de BTS,
c'est la calculatrice qui donne a , b , r directement.
------------------------------------------------------------ -----------------------------------------
5. EXERCICE.
On considère la série pondérée suivante.
xi
3
3
5
5
7
9
yi
4
6
6
8
6
8
ni
3
2
4
1
2
8
Le nuage de points comporte 20 points pas forcément distincts.
a. Vérifier, à l'aide de la calculatrice, que la droite de régression de y en x est :
y = 0,4943 x +3,4861 avec une précision de 1O-4 .
( Attention il faut introduire les 20 couples.)
b. Vérifier que le coefficient de corrélation r = 0,8554 avec une précision de 1O-4 .
Démarche:
◊ TI 84
Effacer les liste L1 et L2.
Pour cela, faire: [ STAT ] ClrList ENTER L1 , L2 ENTER
Ensuite: [ STAT ] ENTER R emplir les 20 couples ( xi , yi )
dans les deux premières colonnes.
[ STAT ] → 4 ENTER
Il apparait: y =a x + b
a =
b =
r2 =
r =
◊ TI 83 Si la corrélation r ne s'affiche pas, faire:
[ 2nd] CATALOG DiagnosticOn ENTER
◊ CASIO Graph 25 ( Pour la méthode des moindres carrés )
Effacement des listes : [ MENU ] [ STAT ] [ EXE ] DEL A
Sélectionner la colonne puis YES [ EXE ]
Rentrer les valeurs de xi en colonne List 1
Rentrer les valeurs de yi en colonne List 2
Régler les colones par CALC SET
2 VAR X List : List 1
2 VAR Y List : List 2
2 VAR Freq : 1 [EXE]
Affichage des résultats par REG X
6 . EXERCICE.
Mêmes questions avec la série statistique définie par le tableau:
x | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 |
y | 15 | 26 | 43 | 45 | 60 | 80 | 85 | 97 | 108 | 129 |
Réponses à trouver : y = 12,1818 x - 10,3818 r = 0,9945
7. EXERCICE.
On considère la série statistique double ( xi , pi ) définie par le tableau:
xi | 1 | 2 | 3 | 4 | 5 |
pi | 7550 | 9235 | 10741 | 12837 | 15655 |
yi = lnpi |
On pose : yi = ln (pi ) a. Compléter le tableau à 1O- 3 près . b. Trouver la droite D: y = a x + b de régression avec la calculatrice de y en x. ( Avec la méthode des moindres carrés.) c. Trouver à la calculatrice le coefficient de corrélation r . d. Donner une estimation de y pour x = 7, puis une estimation entière de p pour x = 7. e. Exprimer p en fonction de x à l'aide y = a x + b . (Cette relation est un ajustement non linéaire de p en x.) Réponses attendues: a.
b. y = 0,179 x + 8,756. c. r = 0,999 d. Pour x = 7 on a y = 10,009
Pour x = 7 on a p = 22 225,5987 soit p = 22 226 e. p =6348,666 e0,179 x METHODE MANUELLE pour la question 1. x‾ = 15 / 5 = 3 y‾ = 46.4605 / 5 = 9.2921 cov(x , y ) = (141.1692 / 5 ) - 3 × 9.2921 = 0.3575
V( x) = 10 / 5 = 2 a = cov( x , y ) / V(x) = 0.3575 / 2 = 0.1788 b = y‾ - a x‾ = 9.2921 - 0.1788 ×3 = 8.7557 On retrouve la même droite de régression. σ(x) = √(V(x) ) = √2 = 1.4142 σ(y) = √(V(y) )
r = cov(x,y ) / ( σ(x) × σ(y ) )
------------------------------ ----------------------------- ---------------------------------
xi
1
2
3
4
5
pi
7550
9235
10741
12837
15655
yi = ln pi
8.9293
9.1308
9.2818
9.4601
9.6585
xi
1
2
3
4
5
∑ = 15
yi
8.9293
9.1308
9.2818
9.4601
9.6585
∑ = 46.4605
xi yi
8.9293
18.2616
27.8454
37.8404
48.2925
∑ = 141.1692
( xi - x‾ )
- 2
- 1
0
1
2
( xi - x‾ )2
4
1
0
1
4
∑ = 10
( yi - y‾ )2
∑ =