Test d'hypothèse pour la différence de deux proportions de population

Test d'hypothèse pour la différence de deux proportions de population

Dans cet article, nous passerons par les étapes nécessaires pour effectuer un test d'hypothèse, ou test de signification, pour la différence de deux proportions de population. Cela nous permet de comparer deux proportions inconnues et de déduire si elles ne sont pas égales l'une à l'autre ou si l'une est supérieure à l'autre.

Aperçu et contexte du test d'hypothèse

Avant d'entrer dans les détails de notre test d'hypothèse, nous examinerons le cadre des tests d'hypothèse. Dans un test de signification, nous essayons de montrer qu'une affirmation concernant la valeur d'un paramètre de population (ou parfois la nature de la population elle-même) est probablement vraie.

Nous rassemblons des preuves pour cette déclaration en effectuant un échantillon statistique. Nous calculons une statistique à partir de cet échantillon. La valeur de cette statistique est ce que nous utilisons pour déterminer la vérité de la déclaration d'origine. Ce processus contient de l'incertitude, mais nous pouvons quantifier cette incertitude

Le processus global pour un test d'hypothèse est donné par la liste ci-dessous:

  1. Assurez-vous que les conditions nécessaires à notre test sont remplies.
  2. Énoncez clairement les hypothèses nulles et alternatives. L'hypothèse alternative peut impliquer un test unilatéral ou bilatéral. Nous devons également déterminer le niveau de signification, qui sera indiqué par la lettre grecque alpha.
  3. Calculez la statistique de test. Le type de statistique que nous utilisons dépend du test particulier que nous effectuons. Le calcul repose sur notre échantillon statistique.
  4. Calculez la valeur de p. La statistique de test peut être traduite en une valeur p. Une valeur de p est la probabilité que le hasard produise à lui seul la valeur de notre statistique de test en supposant que l'hypothèse nulle est vraie. La règle générale est que plus la valeur de p est petite, plus les preuves contre l'hypothèse nulle sont grandes.
  5. Tirer une conclusion. Enfin, nous utilisons la valeur de alpha qui a déjà été sélectionnée comme valeur de seuil. La règle de décision est que si la valeur de p est inférieure ou égale à alpha, alors nous rejetons l'hypothèse nulle. Sinon, nous ne parvenons pas à rejeter l'hypothèse nulle.

Maintenant que nous avons vu le cadre d'un test d'hypothèse, nous allons voir les détails d'un test d'hypothèse pour la différence de deux proportions de population.

Les conditions

Un test d'hypothèse pour la différence de deux proportions de population nécessite que les conditions suivantes soient remplies:

  • Nous avons deux échantillons aléatoires simples provenant de grandes populations. Ici, «grande» signifie que la population est au moins 20 fois plus grande que la taille de l'échantillon. Les tailles d'échantillon seront désignées par n1 et n2.
  • Les individus de nos échantillons ont été choisis indépendamment les uns des autres. Les populations elles-mêmes doivent également être indépendantes.
  • Il y a au moins 10 succès et 10 échecs dans nos deux échantillons.

Tant que ces conditions sont remplies, nous pouvons continuer notre test d'hypothèse.

Les hypothèses nulles et alternatives

Maintenant, nous devons considérer les hypothèses pour notre test de signification. L'hypothèse nulle est notre déclaration sans effet. Dans ce type particulier de test d'hypothèse, notre hypothèse nulle est qu'il n'y a pas de différence entre les deux proportions de population. Nous pouvons écrire ceci comme H0: p1 = p2.

L'hypothèse alternative est l'une des trois possibilités, selon les spécificités de ce que nous testons:

  • Hunep1 est supérieur à p2. Il s'agit d'un test unilatéral ou unilatéral.
  • Hune: p1 est inférieur à p2. Il s'agit également d'un test unilatéral.
  • Hune: p1 n'est pas égal à p2. Il s'agit d'un test bilatéral ou bilatéral.

Comme toujours, pour être prudent, nous devons utiliser l'hypothèse alternative bilatérale si nous n'avons pas de direction en tête avant d'obtenir notre échantillon. La raison de cela est qu'il est plus difficile de rejeter l'hypothèse nulle avec un test bilatéral.

Les trois hypothèses peuvent être réécrites en précisant comment p1 - p2 est lié à la valeur zéro. Pour être plus précis, l'hypothèse nulle deviendrait H0:p1 - p2 = 0. Les hypothèses alternatives potentielles seraient écrites comme suit:

  • Hunep1 - p> 0 équivaut à la déclaration "p1 est supérieur à p2."
  • Hunep1 - p<0 équivaut à la déclaration "p1 est inférieur à p2."
  • Hunep1 - p2  ≠ 0 équivaut à la déclaration "p1 n'est pas égal à p2."

Cette formulation équivalente nous montre en fait un peu plus de ce qui se passe dans les coulisses. Ce que nous faisons dans ce test d'hypothèse est de tourner les deux paramètres p1 et pdans le paramètre unique p1 - p2. Nous testons ensuite ce nouveau paramètre par rapport à la valeur zéro.

La statistique de test

La formule de la statistique de test est donnée dans l'image ci-dessus. Une explication de chacun des termes suit:

  • L'échantillon de la première population a une taille n1. Le nombre de succès de cet échantillon (qui n'est pas directement visible dans la formule ci-dessus) est k1.
  • L'échantillon de la deuxième population a une taille n2. Le nombre de succès de cet échantillon est k2.
  • Les proportions d'échantillon sont p1-chapeau = k1 / net P2-hat = k2 / n2 .
  • Nous combinons ou regroupons ensuite les succès de ces deux échantillons et obtenons: p-chapeau = (k1 + k2) / (n1 + n2).

Comme toujours, faites attention à l'ordre des opérations lors du calcul. Tout sous le radical doit être calculé avant de prendre la racine carrée.

La valeur P

L'étape suivante consiste à calculer la valeur de p qui correspond à notre statistique de test. Nous utilisons une distribution normale standard pour nos statistiques et consultons un tableau de valeurs ou utilisons un logiciel statistique.

Les détails de notre calcul de la valeur p dépendent de l'hypothèse alternative que nous utilisons:

  • Pour Hune: p1 - p> 0, nous calculons la proportion de la distribution normale supérieure à Z.
  • Pour Hune: p1 - p<0, nous calculons la proportion de la distribution normale qui est inférieure à Z.
  • Pour Hune: p1 - p2  ≠ 0, nous calculons la proportion de la distribution normale supérieure à |Z|, la valeur absolue de Z. Après cela, pour tenir compte du fait que nous avons un test bilatéral, nous doublons la proportion.

Règle de décision

Maintenant, nous décidons de rejeter l'hypothèse nulle (et donc d'accepter l'alternative), ou de ne pas rejeter l'hypothèse nulle. Nous prenons cette décision en comparant notre valeur de p au niveau de signification alpha.

  • Si la valeur de p est inférieure ou égale à alpha, alors nous rejetons l'hypothèse nulle. Cela signifie que nous avons un résultat statistiquement significatif et que nous allons accepter l'hypothèse alternative.
  • Si la valeur de p est supérieure à alpha, nous ne rejetons pas l'hypothèse nulle. Cela ne prouve pas que l'hypothèse nulle est vraie. Au lieu de cela, cela signifie que nous n'avons pas obtenu suffisamment de preuves convaincantes pour rejeter l'hypothèse nulle.

Note spéciale

L'intervalle de confiance pour la différence de deux proportions de population ne met pas en commun les succès, contrairement au test d'hypothèse. La raison en est que notre hypothèse nulle suppose que p1 - p2 = 0. L'intervalle de confiance ne suppose pas cela. Certains statisticiens ne regroupent pas les succès de ce test d'hypothèse et utilisent plutôt une version légèrement modifiée de la statistique de test ci-dessus.