Si vous rencontrez un problème de téléchargement de cours, n'hésitez pas à nous contacter pour obtenir des explications Contactez-nous Créer un compte maintenant

Introduction à la statistique inférentielle

Introduction à la statistique inférentielle
SER

Merci de Partager le site web 

 


Cliquez ici Pour voir le contenu de cours   

Center de santé ISPITS PDF example Courses ISPITS infirmier polyvalent PDF Courses des infirmiers polyvalents in Maroc PDF Courses ISPITS avec correction Cours ISPITS bloc operatoire Courses ISPITS infirmier france polyvalent Courses ISPITS PDF Courses ISPITS SVT economie of santé Cours ISPITS information Cours ISPITS Cours ISPITS radiologie Cours ISPITS sage femme Maroc PDF Cours ISPITS s infirmier polyvalent Cours ISPITS exemple Exemple de ISPITS PDF Exemple ISPITS infirmier Infirmier exemple word cours ISPITS PDF sante gov ma gove ISPITS bloc operatoire ISPITS center de santé PDF ISPITS info ISPITS infirmier polyvalen ISPITS infirmier polyvalent exemple word ISPITS kinésithérapie ISPITS laboratoire infirmier PDF ISPITS the concours PDF ISPITS the courses de concours PDF ISPITS ISPITS PDF cours infirmier polyvalent ISPITS PDF the cours des cours des infirmiers polyvalents ISPITS PDF pediatrie ISPITS polyvalent cours ISPITS infirmier exemple Les cours de ISPITS ISFSC Les courses de ISPITS santé and environment PDF Maintenance biomedicale ISPITS course ISPITS radiologie

- - Basée sur l’information d’un échantillon.


 Tirer une conclusion (à travers une


inférence) objective à propos d’une


population.


Relations entre les variables. Quelque soit leur type, deux ou

plusieurs variables sont liées si, dans un échantillon d'observations,

les valeurs de ces variables sont distribuées de manière logique.


Exemple : Les variables « sexe » et « Taux de Globules Blancs

» doivent être considérées comme liées si la plupart des hommes ont

un taux élevé de globules blancs et si la plupart des femmes ont un

taux faible, ou vice versa. Exemple de la « taille » et du « poids ».


Pourquoi les relations entre les variables sont-elles importantes ?

Grâce à ces relations, les vraies causes et conséquences sont

connues, en vue d’établir un plan d’action. Une mise en évidence de

relation(s) est toujours liée à une « signification ».


3


L’utilité de

l’inférence


4


1. La définition


2. La classification des tests


3. Les étapes d’un test


4. La liste des tests usuels


Le test

statistique


Dans la plupart des situations, la vraie valeur du paramètre auquel on

s’intéresse soit inconnue (= celle de la population), mais il arrive que l’on

ait une idée sur cette valeur ou que l’on puisse formuler une hypothèse la

concernant.


Exemple : Un médecin du travail veut savoir si le pourcentage de

travailleurs souffrant de lombalgies dans le groupe industriel dont il a la

charge est égal à 30% (valeur de référence) récemment publiée par la

population générale (une hypothèse est donc formulée). Pour le vérifier,

il constitue un échantillon représentatif de travailleurs du groupe

industriel et calcule le pourcentage de travailleurs atteints de lombalgies

dans cet échantillon. Si la valeur observée est égale à 10%, il faut rejeter

l’hypothèse faite par le médecin du travail en raison de l’écart avec la

valeur supposée de 30%. Par contre si on observe 32% de sujets atteints,

l’hypothèse faite semble raisonnable, et on n’a pas de raison de la rejeter.


L’intuition qui conduit à ces conclusions doit cependant être formalisée

en une règle plus précise et plus objective indiquant les cas où l’on rejette

et ceux où l’on ne rejette pas l’hypothèse faite. Le rôle du test statistique

est de donner cette règle (sous conditions).


1. Définition


6


- Appelé également test d’hypothèse, il permet de choisir une

hypothèse relative à une population, parmi deux hypothèses

envisagées (H0 et H1


). Une seule de ces hypothèses est vraie.


- La décision est basée sur une statistique de test dont la valeur

est calculée à partir d’un ou des échantillons.


- La statistique de test suit une loi de probabilité connue quand

l’hypothèse nulle H0 est vraie. Quelle que soit la décision prise à

l’issue du test statistique, elle est assortie d’une erreur ayant une

probabilité.


7


Si on rejette H0


(= on accepte H1


) alors qu’elle est vraie,

l’erreur commise est une erreur de 1ère espèce. La valeur

de sa probabilité est fixée a priori par la personne

interprétant l’étude.


Si on ne rejette pas H0 (= on l’accepte) alors qu’elle est

fausse, l’erreur commise est une erreur de 2e espèce. La

valeur de sa probabilité n’est pas connue (mais peut être

calculée) et dépend de l’hypothèse H1

.


H0 vraie H0 fausse


H0

acceptée Test OK (proba = 1 - ) Test pas OK (proba = )

H0 rejetée Test pas OK (proba = ) Test OK (proba = 1 - )


8


Région de rejet


Constituée par le sous-ensemble des valeurs de la

distribution d'échantillonnage.

Ces valeurs sont si extrêmes que lorsque H0 est vraie, la

probabilité que l'échantillon observé ait une valeur parmi

celles-ci est très faible (= probabilité alpha).


La position de cette région de rejet est affectée par la

nature de H1


, mais non pas sa taille.


Dans un test unilatéral, la région de rejet est entièrement

située à une des extrémités de la distribution

d'échantillonnage.

Dans un test bilatéral, cette région est située aux deux

extrémités de la distribution.


9


La taille de cette région de rejet est définie par alpha.

Si alpha est = 0,05 (5%), la taille de la région de rejet

correspond à 5% de l'espace inclus dans la courbe de la

distribution d'échantillonnage. Cela signifie que dans une

distribution suivant une loi normale, il n'y a que 5 chances

sur 100 pour que l'écart entre la variable et sa valeur

moyenne dépasse 2 fois l'écart-type.


10


1. Nature des variables : qualitative, quantitative

2. De leur distribution normale ou non (ou effectifs des

groupes)

3. Du nombre de variables (une seule, deux ou plusieurs)

4. Du nombre d’échantillons que l’on veut comparer (2

ou plus)

5. Du caractère apparié ou indépendant des échantillons

Le choix du test dépend :


11


Les tests peuvent être classés selon :


 leur finalité


 le type et le nombre des variables d’intérêt


 les tests paramétriques et les tests non


paramétriques


 le mode de constitution des échantillons


2. Classification

des tests


12


1. Selon leur finalité


La finalité définit l’objectif du test, les hypothèses que l’on veut

opposer, l’information que l’on souhaite extraire des données.


Le test de conformité (conformité à un standard) confronte un

paramètre calculé sur l’échantillon à une valeur préétablie. Les plus

usuels sont les tests portant sur la moyenne ou sur les proportions.

Le test d’adéquation (ou d'ajustement) vérifie la compatibilité des

données avec une distribution choisie a priori. Le plus usuel est le test

d’adéquation à la loi normale.

Le test d’homogénéité (ou de comparaison) vérifie que K

échantillons (groupes) proviennent de la même population ; ou, que

la distribution de la variable d’intérêt est la même dans les K

échantillons.

Le test d’association (ou d’indépendance) consiste à prouver

l’existence d’une liaison entre deux variables (voire plus). Les

techniques utilisées diffèrent selon que les variables sont qualitatives

nominales, ordinales ou quantitatives.


13


2. Selon le type et le nombre de variables


 Pour un même objectif, selon le type de données, nous serons

amenés à mettre en œuvre des tests différents.

Par exemple, pour mesurer l’association entre deux variables :

 quantitatives, on utilisera le coefficient de corrélation de

Pearson ;

 qualitatives nominales, on utilisera le V de Cramer ou le t de

Tschuprow.


 Pour les tests de conformité et d’homogénéité, le test est dit :

 uni-varié s’il ne porte que sur une variable d’intérêt ;

 multi-varié s’il met en jeu simultanément plusieurs variables.


14


3. Les tests paramétriques et les tests non paramétriques

Les tests paramétriques : portent sur des paramètres tels que la

moyenne et la variance.

Ils requièrent un modèle à fortes contraintes ; la normalité des

distributions et l’égalité des variances doivent être vérifiées.

Les hypothèses émises sont d'autant plus difficiles à vérifier que les

effectifs étudiés sont plus réduits.

Les tests non paramétriques : lorsque les hypothèses ne portent pas

sur des paramètres et sont formulées en terme « qualitatifs ».

Ils requièrent un modèle à faibles contraintes ; certaines conditions

d'application doivent être vérifiées. Les échantillons considérées doivent

être aléatoires (tous les individus ont la même probabilité de faire partie de

l'échantillon) et simples (tous les individus sont prélevés indépendamment les

uns des autres), et éventuellement indépendants les uns des autres.


15


Avantages et inconvénients d’un test non paramétrique :


Avantages :

• Son utilisation se justifie lorsque les conditions d'application d’un

test paramétrique ne sont pas satisfaites, même après transformation

de variable(s).


• Les probabilités des résultats de la plupart des ces tests sont des

probabilités exactes quelle que soit la forme de la distribution de

l'échantillon.


• Pour des échantillons de taille très faible (N ≤ 6), la seule possibilité

est l'utilisation d'un test non paramétrique, sauf si la nature exacte de

la distribution de l’échantillon (et donc de la population) est connue.


• Il existe des tests non paramétriques permettant de traiter des

échantillons composés à partir d'observations provenant de

populations différentes. De telles données ne peuvent être traitées

par les tests paramétriques sans faire des hypothèses irréalistes.


16


• Seuls les tests non paramétriques permettent le traitement de

données qualitatives.

• Les tests non paramétriques sont plus facile à apprendre et à

appliquer que les tests paramétriques. Leur relative simplicité réside

dans l’utilisation du rang ou du score.


Inconvénients :


o Les tests paramétriques, quand leurs conditions sont remplies,

sont plus puissants que les tests non paramétriques.


o Il est difficile de trouver la description des tests non paramétriques

et de leurs tables respectives, surtout en langue française.


17


4. Selon le mode de constitution des échantillons


Echantillons indépendants, lorsque les observations sont

indépendantes à l’intérieur des groupes et d’un groupe à l’autre.


Echantillons appariés, d’un groupe à l’autre, les individus sont liés.

C’est le cas lorsque nous procédons à des mesures répétées sur les

mêmes sujets ou encore suite à un appariement cas / témoin.

Ex 1 : on mesure la fièvre d’un patient avant et après la prise d’un

médicament.

Ex 2 : on cherche à évaluer l’exposition à substance toxique sur

l’apparition d’une maladie chez le cas pour 1 témoin (sain).


Étape 1. La question biologique

Étape 2. La déclaration des hypothèses

Étape 3. Le choix du test statistique

Étape 4. Les conditions d'application

Étape 5. La distribution de la variable auxiliaire

Étape 6. Les règles de décision

Étape 7. Le calcul du test !

Étape 8. La décision statistique

Étape 9. L’interprétation biologique


3. Test

statistique en 9

étapes


Étape 1. La question biologique

On formule la problématique à l’aide d’une question simple

Exemple :

-La vitesse catalytique de la fumarase est-elle similaire à celle de

la triose phosphate isomérase?


Étape 2. La déclaration des hypothèses

• On traduit la question biologique en hypothèses statistiques, et on

décide quels paramètres des échantillons nous voulons comparer

(moyenne, variance ...).

• On définit deux hypothèses :

- L’hypothèse nulle: H0

- L’hypothèse contraire: H1


Le test statistique ne teste que H0 : on « accepte » ou on rejette H0

• H0 est toujours une hypothèse de non-effet: « il n’y a pas de

différence entre... » , « il n'y a pas de relation entre... », etc.

• H1 est établi selon nos connaissances du phénomène sous étude :

- si on ne connaît rien : H1 est bilatérale : « il y’a une différence

entre ... » , « il y a une relation entre... »


Exemple :

H0

: La vitesse catalytique moyenne de la fumarase est similaire

de celle de la triose phosphate isomérase (μF = μT

)


H1

: La vitesse catalytique moyenne de la fumarase est différente

de celle de la triose phosphate isomérase (μF ≠ μT

)


- si on a des connaissances détaillées, on peut les utiliser

dans le test : H1 est unilatérale : « ... est significativement

supérieur à ... », « il y a une relation positive entre... ».

Exemple :

H0

: La vitesse catalytique moyenne de la fumarase est similaire de

celle de la triose phosphate isomérase (μF = μT

)


H1

: La vitesse catalytique moyenne de la fumarase est plus élevée

que celle de la triose phosphate isomérase (μF ≠ μT

)


Remarque : L'hypothèse porte sur le paramètre de la population

statistique et non pas sur celui de l'échantillon. C'est le cas d'un test

statistique bien fait lorsqu'il est réalisé sur un échantillon représentatif

de la population statistique : l'inférence se fait sur cette population.


Étape 3. Le choix du test statistique


• Pour savoir si H0 est vraisemblable, on fait appel aux probabilités.


• On choisit donc une statistique. On calcule la statistique sur les

données, puis on compare ce résultat à une distribution théorique de

la statistique en question, telle qu'observée lorsque H0 est vraie.


• La probabilité associée à la statistique calculée à partir des données

de l’échantillon dictera la vraisemblance de H0 et la décision finale : y

a-t-il de grandes chances que la valeur de la statistique, telle que

calculée sur les données, ait pu être obtenue sous H0

?


Étape 4. Les conditions d'application

• Pour associer une distribution de probabilités à une statistique

donnée, il faut que cette distribution respecte certaines conditions. Si

elles ne sont pas respectées, le test ne peut pas être appliqué.

• Les conditions d’application varient en fonction du test choisi.


Étape 5. La distribution de la variable auxiliaire

On déclare ici la distribution de probabilité qui sera utilisée pour

déterminer la probabilité de la statistique choisie.

Exemple : si les données respectent les conditions d'application, et si

H0 est vraie, la variable auxiliaire suivra une distribution t de Student à

ν degrés de liberté.


Étape 6. Les règles de décision


• On détermine dans quel cas on accepte ou rejette H0

.


• Cette décision se prend sur la base d'un seuil α, qui définit le risque

d'erreur qu'on prend en acceptant H0

.


• Règle de décision :

Si P(statistique) > α → on ne rejette pas H0

Si P(statistique) ≤ α → on rejette H0


La probabilité de la statistique peut être obtenue à l'aide de tables

(tables de t, de F, etc.), lorsque toutes les conditions d'application

sont réunies.


Étape 7. Le calcul du test !


Étape 8. La décision statistique

On applique les règles de l’étape 6 aux résultats obtenus à l’étape 7.


Étape 9. L’interprétation biologique


Exemple :

La vitesse catalytique moyenne de la fumarase est similaire de celle

de la triose phosphate isomérase. La différence observée serait du au

hasard.


1. Définir la question biologique, puis déterminer la nature des données à

comparer (variable quantitative ou qualitative) et le type de comparaison

qui devra être effectué. Choisir un test statistique adapté à la taille du (des)

échantillon(s) et à la distribution de la variable dans la population ;


2. Définir l'hypothèse nulle « H0


» et l'hypothèse alternative « H1


» (formulation


bi ou unilatérale du test) ;


3. Définir une statistique, qui sous H0 obéit à une loi de probabilité connue ;


4. Fixer le seuil de décision α (seuil de signification ou risque de se tromper) ;


5. Définir la région critique (de rejet) du test associée à ce seuil ; la région où le

paramètre a, au plus, une probabilité égale à α de se trouver sous H0

;


A retenir ...


Démarche

statistique


6. Comparer la valeur du paramètre calculée à partir des observations à la

valeur théorique correspondant à la distribution de probabilité ;


7. Pour le seuil de décision choisi, conclure si H0 doit être rejetée ou pas.


Si le paramètre calculé appartient à la région de rejet, on rejette H0

. Ce


faisant, on peut se tromper car H0 pourrait être vraie, mais ce risque d'erreur

est inférieur ou égal à α. Le niveau de signification exact peut être déterminé

par la lecture de la table statistique correspondante. Si le paramètre calculé

n'appartient pas à la région de rejet, on ne peut pas rejeter H0

.


Quelle que soit la décision, il reste maintenant à interpréter en termes

biologiques la conclusion statistique qui vient d'être portée.




Le fichier PDF  

pour voir un autre exemple de ce cours cliquez ici 

إرسال تعليق

Cookie Consent
We serve cookies on this site to analyze traffic, remember your preferences, and optimize your experience.
Oops!
Il semble qu'il y ait un problème avec votre connexion Internet. Veuillez vous connecter à Internet et recommencer à naviguer.
AdBlock Detected!
Nous avons détecté que vous utilisez un plugin de blocage des publicités dans votre navigateur.
Les revenus que nous gagnons grâce aux publicités sont utilisés pour gérer ce site Web, nous vous demandons de mettre notre site Web sur liste blanche dans votre plugin de blocage des publicités.
Site is Blocked
Sorry! This site is not available in your country.