Comprendre l'importance du théorème de la limite centrale

Comprendre l'importance du théorème de la limite centrale

Le théorème de la limite centrale est un résultat de la théorie des probabilités. Ce théorème apparaît à plusieurs endroits dans le domaine des statistiques. Bien que le théorème de la limite centrale puisse sembler abstrait et dépourvu de toute application, ce théorème est en réalité assez important pour la pratique de la statistique.

Alors, quelle est exactement l'importance du théorème de la limite centrale? Tout cela a à voir avec la répartition de notre population. Ce théorème vous permet de simplifier les problèmes de statistiques en vous permettant de travailler avec une distribution approximativement normale.

Déclaration du théorème

L’énoncé du théorème de la limite centrale peut sembler assez technique, mais peut être compris si nous réfléchissons aux étapes suivantes. Nous commençons avec un échantillon aléatoire simple avec n les individus d'une population d'intérêt. À partir de cet échantillon, nous pouvons facilement former un échantillon de moyenne qui correspond à la moyenne des mesures qui nous intéressent dans notre population.

Une distribution d'échantillonnage pour la moyenne de l'échantillon est produite en sélectionnant à plusieurs reprises des échantillons aléatoires simples dans la même population et de la même taille, puis en calculant la moyenne de l'échantillon pour chacun de ces échantillons. Ces échantillons doivent être considérés comme étant indépendants les uns des autres.

Le théorème central limite concerne la distribution d'échantillonnage des moyennes d'échantillon. Nous pouvons nous interroger sur la forme générale de la distribution d'échantillonnage. Le théorème limite centrale dit que cette distribution d'échantillonnage est approximativement normale, communément appelée courbe de Bell. Cette approximation s'améliore à mesure que nous augmentons la taille des échantillons aléatoires simples utilisés pour produire la distribution d'échantillonnage.

Il existe une caractéristique très surprenante concernant le théorème de la limite centrale. Le fait étonnant est que ce théorème dit qu’une distribution normale se produit quelle que soit la distribution initiale. Même si notre population a une distribution asymétrique, ce qui se produit lorsque nous examinons des éléments tels que les revenus ou le poids des personnes, une distribution d'échantillonnage pour un échantillon avec une taille d'échantillon suffisamment grande sera normale.

Théorème central limite en pratique

L'apparition inattendue d'une distribution normale à partir d'une distribution de population asymétrique (même très fortement asymétrique) a des applications très importantes en pratique statistique. De nombreuses pratiques statistiques, telles que celles consistant à tester des hypothèses ou des intervalles de confiance, font certaines hypothèses concernant la population à partir de laquelle les données ont été obtenues. Une hypothèse qui est initialement faite dans un cours de statistiques est que les populations avec lesquelles nous travaillons sont normalement réparties.

L'hypothèse selon laquelle les données proviennent d'une distribution normale simplifie les choses mais semble un peu irréaliste. Un peu de travail avec des données du monde réel montre que les valeurs aberrantes, les asymétries, les pics multiples et l’asymétrie sont très fréquents. Nous pouvons contourner le problème des données provenant d'une population qui n'est pas normale. L'utilisation d'une taille d'échantillon appropriée et du théorème de la limite centrale nous aide à résoudre le problème des données provenant de populations qui ne sont pas normales.

Ainsi, même si nous ne connaissons peut-être pas la forme de la distribution d'où proviennent nos données, le théorème de la limite centrale dit que nous pouvons traiter la distribution d'échantillonnage comme si elle était normale. Bien sûr, pour que les conclusions du théorème tiennent, nous avons besoin d’une taille d’échantillon suffisamment grande. L'analyse exploratoire des données peut nous aider à déterminer la taille d'un échantillon nécessaire à une situation donnée.