Cours statistiques SVI S3



Cours statistiques  SVI S3
Cours statistiques  SVI S3
 LE COURE DE STATISTIQUE SVI S3


1°)Définition    
La statistique étudie certaines caractéristiques : caractères ou variables d'un ensemble fini appellé population. Les éléments de cette population étudiée sont appelés individus.
2°)Type de variables   

2.1°)Définition

Une variable peut être :

  • Quantitative : numérique et fait l'objet de calcul  ( âge, taille, poids, notes, nombres d'heures etc ...)
  • Qualitative : c'est le contraire de quantitative, mais la variable peut très bien être numérique.
  • Discrète : si la variable ne prend qu'un nombre fini de valeurs (ces valeurs sont appelées modalités et notéesxi ) .
  • Continue : si la variable prend ses valeurs dans un intervalle (classe )
2.2°) Exemple

Supposons que l'on veut faire une étude statistique sur les 50 notes attribuées par un jury à un examen. 

On dispose pour cette étude de la liste des notes obtenues :

On peut regrouper ces notes par ordre croissant :0,1,1,2,2,3,3,3 ..., et construire le tableau suivant : ( dans ce cas la distribution est discrète )



Ou bien regrouper ces notes par intervalle ( classe ) :
( dans ce cas la distribution est continue )
Exemple de regroupement par classe :


3°)Effectif 

L'effectif d'une classe ou d'une modalité est le nombre d'individu de  cette classe ou de cette modalité. Généralement on note ni est l'effectif de la classe n°  i ( ou de la modalité xi ).L'effectif total est la somme des effectifs de toutes les classes.
On le note souvent N, on a alors : N = n1 + n2 + n3 + n4 + n5 = 50 . En utilisant la notation sigma :




4°)Fréquence 


4.1°) Définition

La fréquence fi de la classes i ou de la modalité xi est le rapport fi/N , la fréquence d'une classe est un nombre de l'intervalle [0 ;1]
L'effectif cumulé d'une modalité est la somme des effectifs des modalités qui lui sont inférieures ou égales
La fréquence cumulée d'une modalité est la somme des fréquences des modalités qui lui sont inférieures ou égales

4.2°) Exemples :

Dans le cas "variable discrète" on obtient :




  • 3 personnes ont une note inférieure ou égale à 1 .
  • 15 personnes ont une note inférieure ou égale à 6 .
  • 47 personnes ont une note inférieure ou égale à 18 .
  • etc...



Dans le cas "variable continue" on obtient :




5°) Etendue d'une série statistique 

5.1°) Définition:

L'étendue d'une série statistique est la différence entre la plus grande modalité du caractère et la plus petite modalité.

5.2°) Exemple:


20 - 0 = 20,
20 est l'étendue de ces deux séries ( continue et discrète )


6°) Histogramme 

Définition;

C'est la représentation d'une série groupée par classe en diagrammes en fonction du caractère étudié, sous forme de rectangle.

Exemple

Les tailles des élèves d'une classe de 2nde sont en cm :

174160161166177172157175162
169160165170152168156163167
169158164151162166156165179


Le regroupement par classes donne :

Tailles150 ≤ t < 155155 ≤ t < 160160 ≤ t < 165165 ≤ t < 170170 ≤ t < 175175 ≤ t < 180
Effectifs247833
Fréquences71526301111


L'effectif total est 27.
L'histogramme est donc :



7°) Polygone des effectifs cumulés croissants  

Définition;

C'est la représentation des effectifs cumulés croissant en fonction du caractère étudié, sous forme de portiosn de droites.

Exemple:

Le tableau des effectifs cumulés de l'exemple précédent est :

Taillest < 155t < 160t < 165t < 170t < 175t < 180
Effectifs cumulés croissants2613212427
Fréquences cumulées croissantes en %722487889100


  • Le pourcentage d'élèves dont la taille est inférieure à 170 cm est: 78 %.
  • Le pourcentage d'élèves dont la taille est comprise entre 160 cm et 170 cm est : 78 - 22 = 56 %.
  • le nombre d'élèves dont la taille est supérieure à 165 cm est: 27 - 13 = 14.


Le polygone des effectifs cumulés croissants est :






8°) Mode d'une série statistique 

8.1°) Définition:

Dans le cas d'une série statistique continue, la classe modale est la classe du plus grand effectif :


8.2°) Exemple:




Sur cette exemple, la classe modale est donc  


Dans le cas d'une série statistique discrète, le mode est la valeur de plus grand effectif :

   


9°) Moyenne 


9.1°) Définition

  • n1, n2, n3, .........,nsont les effectifs correspondants aux modalités x1, x2, x3, .........,xN., si la série est discrète ,
  • ou les centres de chaque classe, si la série est continue.

9.2°) Exemple:
Série discrèteSérie continue


9.3°) Propriétés de la moyenne:
  • Considérons une série statistique S de modalités x1, x2, x3, .........,xNaffectées des effectifs n1, n2, n3, ... ,nN de moyenne ,
    et la série statistique S' de modalités y1, y2, y3, ... ,yaffectées des même effectifs n1, ... ,ntelle que pour tout i appartenant à {1 ; 2 ; ... ; N } :
    yi = axi + b.


    Alors: la moyenne de la série statistique S' est telle que :
                     = a  + b.


  • Soient S1 et Sdeux séries statistiques d'effectifs totaux respectifs N1 etN2 et de moyennes respectives  et .
    Alors la moyenne de la série S regroupant les deux séries S1 et S2 est :
         = [N1 + N2 ]/(N1 + N2).   (cette propriété se généralise).





10°) Variance et écart type  


10.1°) Définition

   8.1.a°)


Pour calculer la variance d'une série statistique on utilise la formule :

Pour calculer la variance , il faut  calculer d'abord la moyenne.


   10.1.b°)

La variance peut être calculée aussi en utilisant la formule :


Preuve:




10.2°) Ecart-type:

L'écart-type est le nombre noté  tel que : .

Le coefficient de dispersion est le rapport écart-type moyenne  : /x




10.3°) Propriété de l'écart type :

  • Considérons une série statistique S de modalités x1, x2, x3,...,xaffectées des effectifsn1, n2, n3, ...,nN d'écart type ,
    et la série statistique S' de modalités y1, y2, y3, ...,yaffectées des mêmes effectifsn1,n2,n3, ...,ntelle que, pour tout i appartenant à {1 ; 2 ; ...; N } :
    yi = axi + b.


    Alors l'écart type :  de la série statistique S' est tel que :  = |a| 




11°) Médiane  

11.1°) Définition

La médiane est un paramètre de position, qui permet de couper la population étudiée en deux groupes contenant le même nombre d'individus.
Ce paramètre est utile pour donner la répartition du caractère étudié,
car 50 % environ de la population étudiée a une modalité inférieure à lamédiane et 50 % une modalité supérieure à la médiane.


11.2°) Exemple

On fait une étude statistique sur les 50 notes attribuées par un jury à un examen, voici les résultats obtenus en classant ces notes par ordre croissant.
Variable discrète

Utilisons la colonne des effectifs cumuléspour déterminer la médiane : il y a 50 notes, la  25ème note est 9 et la 26ème : 10.Voici la répartition des notes :

Dans le tableau il n'y a pas de valeur partageant la série statistique en deux groupe de même effectif , ( l'effectif total est pair ) dans ce cas l'intervalle médianest [9;10] et on prendre pour médiane lecentre de cet intervalle : 9,5


Variable continue

Si la variable est continue ( regroupement par intervalle des résultats )  le calcul de la médiane se fait autrement :

Utilisons la colonne des effectifs cumuléspour déterminer la médiane : Il y a 50 notes, 50 % de l'effectif total c'est 25, la médiane est ici la note correspondant àl'effectif cumulé 25.
D'après la colonne "effectif cumulé" :
  • 18 personnes  ont moins de 8
  • 30 personnes ont moins de 12
La médiane se trouve donc dans l'intervalle [8;12[ ( appelé classe médiane ). On le détermine par interpolation linéaire.




Les points A, M, B sont alignés ce qui se traduit par les droites (AM) et (AB) ontmême coefficient directeur (ou on utilise le théorème de Thalès dans le triangle bleu ) :




La médiane est environ 10,3350 % environ des personnes ont eu moins de 10,33 et 50 % plus de 10,33 .




12°) Interpolation linéaire  


12.1°) Définition:

Soit f une fonction définie sur , [a; b] un intervalle de  et c un nombre réel . Quand il n'est pas possible de calculer l'image de c par f , on utilise une interpolation linéaire, cela consiste à remplacer f(c) par g(c) ou g est lafonction affine telle que : g(a) = f(a) etg(b) = f(b). Cela consiste à remplacer la courbe représentative de f sur [a; b] par ladroite (AB)  ( On dit que l'on a déterminé f(c) par interpolation linéaire.


12.2°) Exemple:

L'interpolation linéaire est utilisée surtout en statistique

Le mieux est de comprendre sur un exemple :
.

Supposons que l'on étudie la répartition des âges dans une association par exemple.
D'après le tableau ci-dessus on a :
  • 14 personnes qui ont un âge compris entre 0 et 10 ans
  • 32 personnes qui ont un âge compris entre 10 et 20 ans
  • etc...
La colonne des effectifs cumulés croissants nous permet de savoir que :
  • 14 personnes ont un âge inférieur à 10 ans
  • 46 personnes ont un âge inférieur à 20 ans
  • etc...
Supposons maintenant que l'on a ordonné ces personnes par ordre croissant de leur âge ( du plus jeunes au plus vieux) et que l'on veuille trouver par interpolation l'âge de la 72 ème personne.
On repère à l'aide de la colonne des effectifs cumulés croissants dans quelles tranches d'âge ce trouve cette personne.


La 72 ème personne a entre 20 et 30 ans c'est sûr , mais cela ne suffit pas ...

On considérant que les 55 personnes de la tranche [20;30[ sont réparties demanière proportionnelle :
  • la 46ème personne a moins de 20 ans, faisons comme si elle en avait 20 
  • la 101 ème personne a moins de 30 ans faisons comme si elle en avait 30

Ces deux schémas ci-dessous devraient vous aider à comprendre :






Utilisons Le théorème de Thalès dans le triangle bleu.
La 72 ème personne a presque 25 ans.





13°) Fluctuation et échantillonnage 

13.1°) Echantillon:

Définition:



Remarques:



Exemples:





13.2°) Fluctuation d'un échantillonnage:

Définition:



Exemple:





13.3°) Intervalle de fluctuation:

Définition:



Exemple:



Propriété:



Remarque:



Exemple:





13.4°) Intervalle de confiance:

Définition:



Propriété:

 

No comments:

Post a Comment