Recherche de site Web

Comment effectuer un test T sur un échantillon en Python ?


Introduction

Le test T sur un échantillon est un test d'hypothèse statistique utilisé pour déterminer si une moyenne de population est significativement différente d'une valeur hypothétique. Python nous donne les ressources dont nous avons besoin pour réaliser ce test. Dans cet article, nous expliquerons comment effectuer un test T sur un échantillon en Python à l'aide de la bibliothèque SciPy.

Réalisation d'un test T sur un échantillon

La première étape de la réalisation d’un test T sur un échantillon consiste à énoncer les hypothèses nulles et alternatives. L'hypothèse nulle est l'hypothèse selon laquelle la moyenne de la population est égale à la valeur hypothétique. L’hypothèse alternative est à l’opposé de l’hypothèse nulle. C'est l'hypothèse que la moyenne de la population n'est pas égale à la valeur hypothétique.

En supposant que nous disposons d'un ensemble de données et d'une valeur hypothétique pour la moyenne de la population, nous pouvons effectuer un test T sur un échantillon pour déterminer si la moyenne de la population est significativement différente de la valeur hypothétique. Voici les étapes pour effectuer un test T sur un échantillon en Python à l'aide de la bibliothèque SciPy -

Étape 1 : Importer les bibliothèques requises

L'importation des bibliothèques essentielles sera la première étape. Pour effectuer le One Sample T-Test en Python, nous devons importer les bibliothèques NumPy et SciPy. Alors que les opérations statistiques sont effectuées à l'aide de la bibliothèque SciPy, les opérations mathématiques sont effectuées à l'aide de la bibliothèque NumPy.

import numpy as np
from scipy.stats import ttest_1samp

Étape 2 : Charger les données

Les données doivent ensuite être chargées dans Python. La méthode loadtxt() du module NumPy peut nous y aider. Le nom du fichier est passé en paramètre à la fonction loadtxt(), qui produit un tableau contenant le contenu.

data = np.loadtxt('data.txt')

Étape 3 : Définir la valeur hypothétique

Il faut préciser la valeur hypothétique de la moyenne de la population. Ce chiffre servira de référence pour évaluer si la moyenne de la population s’écarte significativement de la valeur estimée.

hypothesized_value = 50

Étape 4 : Effectuer le test T sur un échantillon

Nous sommes maintenant prêts à exécuter le test T sur un échantillon. La fonction ttest_1samp() de la bibliothèque SciPy peut être utilisée pour exécuter le test T One Sample. Les données et la valeur hypothétique sont les deux arguments requis par la fonction ttest_1samp().

t_statistic, p_value = ttest_1samp(data, hypothesized_value)

La statistique de test et la valeur p sont les résultats de la fonction ttest_1samp(). La statistique t calcule l'erreur standard d'une variance par rapport à la moyenne de l'échantillon avec la valeur hypothétique. La valeur p, sous l’hypothèse nulle, est la probabilité de générer une statistique t aussi sévère que celle observée.

Étape 5 : Interpréter les résultats

Enfin, nous devons interpréter les résultats du One Sample T-Test. En comparant la valeur p et le niveau de signification, nous pouvons y parvenir. Le niveau de signification est le seuil en dessous duquel l’hypothèse nulle est rejetée. Si la valeur p est inférieure à 0,05, qui est le niveau de signification conventionnel, l'hypothèse nulle est rejetée.

if p_value <r; 0.05:
   print('Reject Null Hypothesis')
else:
   print('Fail to Reject Null Hypothesis')

Nous rejetons l'hypothèse nulle et concluons que la moyenne de la population diffère significativement de la valeur hypothétique si la valeur p est inférieure à 0,05. Si la valeur p est supérieure ou égale à 0,05, nous ne pouvons pas rejeter l’hypothèse nulle et conclure que la moyenne de la population et la valeur hypothétique ne diffèrent pas significativement.

Le test T sur un échantillon suppose que les données sont normalement distribuées, ce qui est important à noter. Nous devrons peut-être utiliser un test statistique différent, comme le test de rang signé de Wilcoxon, si les données ne sont pas régulièrement distribuées. Le test T sur un échantillon suppose également que les données sont indépendantes et tirées au hasard de la population. Les résultats des tests peuvent ne pas être précis si certaines présomptions ne sont pas remplies.

Exemple avec code et sortie

Voici un exemple de la façon d'utiliser la bibliothèque SciPy pour effectuer un test T à un échantillon en Python -

Disons que nous disposons d'un ensemble d'informations comprenant le poids d'un échantillon de pommes. Nous souhaitons déterminer si le poids moyen des pommes dans la population s'écarte significativement de 100 grammes. En utilisant Python, nous pouvons effectuer un test T sur un échantillon comme suit -

import numpy as np
from scipy.stats import ttest_1samp

# Load the data
data = np.array([98, 102, 95, 105, 99, 101, 97, 103, 100, 98])

# Define the hypothesized value
hypothesized_value = 100

# Perform the One Sample T-Test
t_statistic, p_value = ttest_1samp(data, hypothesized_value)

# Interpret the results
if p_value < 0.05:
   print('Reject Null Hypothesis')
else:
   print('Fail to Reject Null Hypothesis')

Sortir

Fail to Reject Null Hypothesis

La valeur p étant dans ce cas supérieure à 0,05, nous ne pouvons pas exclure l’hypothèse nulle. Nous concluons qu'au niveau de signification de 0,05, il n'y a pas de différence entre le poids moyen des pommes dans la population et celui de 100 grammes.

Conclusion

En conclusion, il est assez simple d’effectuer un One Sample T-Test en Python. La bibliothèque SciPy nous donne les outils dont nous avons besoin pour effectuer le test. Importez simplement les données, fournissez la valeur hypothétique, exécutez le test T sur un échantillon à l'aide de la fonction ttest_1samp(), puis comparez la valeur p au niveau de signification pour interpréter les résultats. Ces étapes permettent d'évaluer si la moyenne de la population diffère considérablement de la valeur hypothétique.

Articles connexes