Merci de Partager le site web
Cliquez ici Pour voir le contenu de cours
Center de santé
ISPITS PDF example Courses ISPITS infirmier polyvalent PDF Courses des
infirmiers polyvalents in Maroc PDF Courses ISPITS avec correction Cours
ISPITS bloc operatoire Courses ISPITS infirmier france polyvalent Courses ISPITS PDF
Courses ISPITS SVT economie of santé Cours ISPITS information Cours ISPITS
Cours ISPITS radiologie Cours ISPITS sage femme Maroc PDF Cours ISPITS s
infirmier polyvalent Cours ISPITS exemple Exemple de ISPITS PDF Exemple
ISPITS infirmier Infirmier exemple word cours ISPITS PDF sante gov ma gove
ISPITS bloc operatoire ISPITS center de santé PDF ISPITS info ISPITS infirmier
polyvalen ISPITS infirmier polyvalent exemple word ISPITS kinésithérapie ISPITS
laboratoire infirmier PDF ISPITS the concours PDF ISPITS the courses de
concours PDF ISPITS ISPITS PDF cours infirmier polyvalent
ISPITS PDF the cours des cours des infirmiers polyvalents ISPITS PDF pediatrie ISPITS polyvalent cours ISPITS infirmier
exemple Les cours de ISPITS ISFSC Les courses de ISPITS santé and environment
PDF Maintenance biomedicale ISPITS course ISPITS radiologie
- - Basée sur l’information d’un échantillon.
Tirer une conclusion (à travers une
inférence) objective à propos d’une
population.
Relations entre les variables. Quelque soit leur type, deux ou
plusieurs variables sont liées si, dans un échantillon d'observations,
les valeurs de ces variables sont distribuées de manière logique.
Exemple : Les variables « sexe » et « Taux de Globules Blancs
» doivent être considérées comme liées si la plupart des hommes ont
un taux élevé de globules blancs et si la plupart des femmes ont un
taux faible, ou vice versa. Exemple de la « taille » et du « poids ».
Pourquoi les relations entre les variables sont-elles importantes ?
Grâce à ces relations, les vraies causes et conséquences sont
connues, en vue d’établir un plan d’action. Une mise en évidence de
relation(s) est toujours liée à une « signification ».
3
L’utilité de
l’inférence
4
1. La définition
2. La classification des tests
3. Les étapes d’un test
4. La liste des tests usuels
Le test
statistique
Dans la plupart des situations, la vraie valeur du paramètre auquel on
s’intéresse soit inconnue (= celle de la population), mais il arrive que l’on
ait une idée sur cette valeur ou que l’on puisse formuler une hypothèse la
concernant.
Exemple : Un médecin du travail veut savoir si le pourcentage de
travailleurs souffrant de lombalgies dans le groupe industriel dont il a la
charge est égal à 30% (valeur de référence) récemment publiée par la
population générale (une hypothèse est donc formulée). Pour le vérifier,
il constitue un échantillon représentatif de travailleurs du groupe
industriel et calcule le pourcentage de travailleurs atteints de lombalgies
dans cet échantillon. Si la valeur observée est égale à 10%, il faut rejeter
l’hypothèse faite par le médecin du travail en raison de l’écart avec la
valeur supposée de 30%. Par contre si on observe 32% de sujets atteints,
l’hypothèse faite semble raisonnable, et on n’a pas de raison de la rejeter.
L’intuition qui conduit à ces conclusions doit cependant être formalisée
en une règle plus précise et plus objective indiquant les cas où l’on rejette
et ceux où l’on ne rejette pas l’hypothèse faite. Le rôle du test statistique
est de donner cette règle (sous conditions).
1. Définition
6
- Appelé également test d’hypothèse, il permet de choisir une
hypothèse relative à une population, parmi deux hypothèses
envisagées (H0 et H1
). Une seule de ces hypothèses est vraie.
- La décision est basée sur une statistique de test dont la valeur
est calculée à partir d’un ou des échantillons.
- La statistique de test suit une loi de probabilité connue quand
l’hypothèse nulle H0 est vraie. Quelle que soit la décision prise à
l’issue du test statistique, elle est assortie d’une erreur ayant une
probabilité.
7
Si on rejette H0
(= on accepte H1
) alors qu’elle est vraie,
l’erreur commise est une erreur de 1ère espèce. La valeur
de sa probabilité est fixée a priori par la personne
interprétant l’étude.
Si on ne rejette pas H0 (= on l’accepte) alors qu’elle est
fausse, l’erreur commise est une erreur de 2e espèce. La
valeur de sa probabilité n’est pas connue (mais peut être
calculée) et dépend de l’hypothèse H1
.
H0 vraie H0 fausse
H0
acceptée Test OK (proba = 1 - ) Test pas OK (proba = )
H0 rejetée Test pas OK (proba = ) Test OK (proba = 1 - )
8
Région de rejet
Constituée par le sous-ensemble des valeurs de la
distribution d'échantillonnage.
Ces valeurs sont si extrêmes que lorsque H0 est vraie, la
probabilité que l'échantillon observé ait une valeur parmi
celles-ci est très faible (= probabilité alpha).
La position de cette région de rejet est affectée par la
nature de H1
, mais non pas sa taille.
Dans un test unilatéral, la région de rejet est entièrement
située à une des extrémités de la distribution
d'échantillonnage.
Dans un test bilatéral, cette région est située aux deux
extrémités de la distribution.
9
La taille de cette région de rejet est définie par alpha.
Si alpha est = 0,05 (5%), la taille de la région de rejet
correspond à 5% de l'espace inclus dans la courbe de la
distribution d'échantillonnage. Cela signifie que dans une
distribution suivant une loi normale, il n'y a que 5 chances
sur 100 pour que l'écart entre la variable et sa valeur
moyenne dépasse 2 fois l'écart-type.
10
1. Nature des variables : qualitative, quantitative
2. De leur distribution normale ou non (ou effectifs des
groupes)
3. Du nombre de variables (une seule, deux ou plusieurs)
4. Du nombre d’échantillons que l’on veut comparer (2
ou plus)
5. Du caractère apparié ou indépendant des échantillons
Le choix du test dépend :
11
Les tests peuvent être classés selon :
leur finalité
le type et le nombre des variables d’intérêt
les tests paramétriques et les tests non
paramétriques
le mode de constitution des échantillons
2. Classification
des tests
12
1. Selon leur finalité
La finalité définit l’objectif du test, les hypothèses que l’on veut
opposer, l’information que l’on souhaite extraire des données.
Le test de conformité (conformité à un standard) confronte un
paramètre calculé sur l’échantillon à une valeur préétablie. Les plus
usuels sont les tests portant sur la moyenne ou sur les proportions.
Le test d’adéquation (ou d'ajustement) vérifie la compatibilité des
données avec une distribution choisie a priori. Le plus usuel est le test
d’adéquation à la loi normale.
Le test d’homogénéité (ou de comparaison) vérifie que K
échantillons (groupes) proviennent de la même population ; ou, que
la distribution de la variable d’intérêt est la même dans les K
échantillons.
Le test d’association (ou d’indépendance) consiste à prouver
l’existence d’une liaison entre deux variables (voire plus). Les
techniques utilisées diffèrent selon que les variables sont qualitatives
nominales, ordinales ou quantitatives.
13
2. Selon le type et le nombre de variables
Pour un même objectif, selon le type de données, nous serons
amenés à mettre en œuvre des tests différents.
Par exemple, pour mesurer l’association entre deux variables :
quantitatives, on utilisera le coefficient de corrélation de
Pearson ;
qualitatives nominales, on utilisera le V de Cramer ou le t de
Tschuprow.
Pour les tests de conformité et d’homogénéité, le test est dit :
uni-varié s’il ne porte que sur une variable d’intérêt ;
multi-varié s’il met en jeu simultanément plusieurs variables.
14
3. Les tests paramétriques et les tests non paramétriques
Les tests paramétriques : portent sur des paramètres tels que la
moyenne et la variance.
Ils requièrent un modèle à fortes contraintes ; la normalité des
distributions et l’égalité des variances doivent être vérifiées.
Les hypothèses émises sont d'autant plus difficiles à vérifier que les
effectifs étudiés sont plus réduits.
Les tests non paramétriques : lorsque les hypothèses ne portent pas
sur des paramètres et sont formulées en terme « qualitatifs ».
Ils requièrent un modèle à faibles contraintes ; certaines conditions
d'application doivent être vérifiées. Les échantillons considérées doivent
être aléatoires (tous les individus ont la même probabilité de faire partie de
l'échantillon) et simples (tous les individus sont prélevés indépendamment les
uns des autres), et éventuellement indépendants les uns des autres.
15
Avantages et inconvénients d’un test non paramétrique :
Avantages :
• Son utilisation se justifie lorsque les conditions d'application d’un
test paramétrique ne sont pas satisfaites, même après transformation
de variable(s).
• Les probabilités des résultats de la plupart des ces tests sont des
probabilités exactes quelle que soit la forme de la distribution de
l'échantillon.
• Pour des échantillons de taille très faible (N ≤ 6), la seule possibilité
est l'utilisation d'un test non paramétrique, sauf si la nature exacte de
la distribution de l’échantillon (et donc de la population) est connue.
• Il existe des tests non paramétriques permettant de traiter des
échantillons composés à partir d'observations provenant de
populations différentes. De telles données ne peuvent être traitées
par les tests paramétriques sans faire des hypothèses irréalistes.
16
• Seuls les tests non paramétriques permettent le traitement de
données qualitatives.
• Les tests non paramétriques sont plus facile à apprendre et à
appliquer que les tests paramétriques. Leur relative simplicité réside
dans l’utilisation du rang ou du score.
Inconvénients :
o Les tests paramétriques, quand leurs conditions sont remplies,
sont plus puissants que les tests non paramétriques.
o Il est difficile de trouver la description des tests non paramétriques
et de leurs tables respectives, surtout en langue française.
17
4. Selon le mode de constitution des échantillons
Echantillons indépendants, lorsque les observations sont
indépendantes à l’intérieur des groupes et d’un groupe à l’autre.
Echantillons appariés, d’un groupe à l’autre, les individus sont liés.
C’est le cas lorsque nous procédons à des mesures répétées sur les
mêmes sujets ou encore suite à un appariement cas / témoin.
Ex 1 : on mesure la fièvre d’un patient avant et après la prise d’un
médicament.
Ex 2 : on cherche à évaluer l’exposition à substance toxique sur
l’apparition d’une maladie chez le cas pour 1 témoin (sain).
Étape 1. La question biologique
Étape 2. La déclaration des hypothèses
Étape 3. Le choix du test statistique
Étape 4. Les conditions d'application
Étape 5. La distribution de la variable auxiliaire
Étape 6. Les règles de décision
Étape 7. Le calcul du test !
Étape 8. La décision statistique
Étape 9. L’interprétation biologique
3. Test
statistique en 9
étapes
Étape 1. La question biologique
On formule la problématique à l’aide d’une question simple
Exemple :
-La vitesse catalytique de la fumarase est-elle similaire à celle de
la triose phosphate isomérase?
Étape 2. La déclaration des hypothèses
• On traduit la question biologique en hypothèses statistiques, et on
décide quels paramètres des échantillons nous voulons comparer
(moyenne, variance ...).
• On définit deux hypothèses :
- L’hypothèse nulle: H0
- L’hypothèse contraire: H1
Le test statistique ne teste que H0 : on « accepte » ou on rejette H0
• H0 est toujours une hypothèse de non-effet: « il n’y a pas de
différence entre... » , « il n'y a pas de relation entre... », etc.
• H1 est établi selon nos connaissances du phénomène sous étude :
- si on ne connaît rien : H1 est bilatérale : « il y’a une différence
entre ... » , « il y a une relation entre... »
Exemple :
H0
: La vitesse catalytique moyenne de la fumarase est similaire
de celle de la triose phosphate isomérase (μF = μT
)
H1
: La vitesse catalytique moyenne de la fumarase est différente
de celle de la triose phosphate isomérase (μF ≠ μT
)
- si on a des connaissances détaillées, on peut les utiliser
dans le test : H1 est unilatérale : « ... est significativement
supérieur à ... », « il y a une relation positive entre... ».
Exemple :
H0
: La vitesse catalytique moyenne de la fumarase est similaire de
celle de la triose phosphate isomérase (μF = μT
)
H1
: La vitesse catalytique moyenne de la fumarase est plus élevée
que celle de la triose phosphate isomérase (μF ≠ μT
)
Remarque : L'hypothèse porte sur le paramètre de la population
statistique et non pas sur celui de l'échantillon. C'est le cas d'un test
statistique bien fait lorsqu'il est réalisé sur un échantillon représentatif
de la population statistique : l'inférence se fait sur cette population.
Étape 3. Le choix du test statistique
• Pour savoir si H0 est vraisemblable, on fait appel aux probabilités.
• On choisit donc une statistique. On calcule la statistique sur les
données, puis on compare ce résultat à une distribution théorique de
la statistique en question, telle qu'observée lorsque H0 est vraie.
• La probabilité associée à la statistique calculée à partir des données
de l’échantillon dictera la vraisemblance de H0 et la décision finale : y
a-t-il de grandes chances que la valeur de la statistique, telle que
calculée sur les données, ait pu être obtenue sous H0
?
Étape 4. Les conditions d'application
• Pour associer une distribution de probabilités à une statistique
donnée, il faut que cette distribution respecte certaines conditions. Si
elles ne sont pas respectées, le test ne peut pas être appliqué.
• Les conditions d’application varient en fonction du test choisi.
Étape 5. La distribution de la variable auxiliaire
On déclare ici la distribution de probabilité qui sera utilisée pour
déterminer la probabilité de la statistique choisie.
Exemple : si les données respectent les conditions d'application, et si
H0 est vraie, la variable auxiliaire suivra une distribution t de Student à
ν degrés de liberté.
Étape 6. Les règles de décision
• On détermine dans quel cas on accepte ou rejette H0
.
• Cette décision se prend sur la base d'un seuil α, qui définit le risque
d'erreur qu'on prend en acceptant H0
.
• Règle de décision :
Si P(statistique) > α → on ne rejette pas H0
Si P(statistique) ≤ α → on rejette H0
La probabilité de la statistique peut être obtenue à l'aide de tables
(tables de t, de F, etc.), lorsque toutes les conditions d'application
sont réunies.
Étape 7. Le calcul du test !
Étape 8. La décision statistique
On applique les règles de l’étape 6 aux résultats obtenus à l’étape 7.
Étape 9. L’interprétation biologique
Exemple :
La vitesse catalytique moyenne de la fumarase est similaire de celle
de la triose phosphate isomérase. La différence observée serait du au
hasard.
1. Définir la question biologique, puis déterminer la nature des données à
comparer (variable quantitative ou qualitative) et le type de comparaison
qui devra être effectué. Choisir un test statistique adapté à la taille du (des)
échantillon(s) et à la distribution de la variable dans la population ;
2. Définir l'hypothèse nulle « H0
» et l'hypothèse alternative « H1
» (formulation
bi ou unilatérale du test) ;
3. Définir une statistique, qui sous H0 obéit à une loi de probabilité connue ;
4. Fixer le seuil de décision α (seuil de signification ou risque de se tromper) ;
5. Définir la région critique (de rejet) du test associée à ce seuil ; la région où le
paramètre a, au plus, une probabilité égale à α de se trouver sous H0
;
A retenir ...
Démarche
statistique
6. Comparer la valeur du paramètre calculée à partir des observations à la
valeur théorique correspondant à la distribution de probabilité ;
7. Pour le seuil de décision choisi, conclure si H0 doit être rejetée ou pas.
Si le paramètre calculé appartient à la région de rejet, on rejette H0
. Ce
faisant, on peut se tromper car H0 pourrait être vraie, mais ce risque d'erreur
est inférieur ou égal à α. Le niveau de signification exact peut être déterminé
par la lecture de la table statistique correspondante. Si le paramètre calculé
n'appartient pas à la région de rejet, on ne peut pas rejeter H0
.
Quelle que soit la décision, il reste maintenant à interpréter en termes
biologiques la conclusion statistique qui vient d'être portée.
Le fichier PDF
pour voir un autre exemple de ce cours cliquez ici