Fonction SciPy stats.normaltest

Lakshay Kapoor 30 janvier 2023
  1. La fonction scipy.stats.normaltest
  2. Fonction scipy.stats.normaltest utilisant numpy.linspace()
  3. Fonction scipy.stats.normaltest utilisant des données aléatoires
Fonction SciPy stats.normaltest

Le test de normalité dans les statistiques permet de calculer comment une variable aléatoire dans un ensemble de données donné est normalement distribuée. En outre, ce test est utilisé pour prédire dans quelle mesure un ensemble donné de données est structuré par la distribution normale.

La fonction scipy.stats.normaltest

La fonction scipy.stats.normaltest de la bibliothèque SciPy est utilisée pour vérifier si une valeur d’échantillon donnée s’écarte de la distribution normale de l’ensemble de données. Cette fonction vérifie également s’il existe ou non une différence entre certaines caractéristiques des données. Ce processus est aussi appelé hypothèse nulle. Cette fonction est définie comme scipy.stats.normaltest(a, axis, nan_policy)

Voici les paramètres de la fonction scipy.stats.normaltest.

a (tableau) définit le tableau d’entrée qui contient les données échantillons qui doivent être testées.
axis (int) définit l’axe le long duquel la fonction effectue le test des données échantillons. La valeur par défaut est 0, c’est-à-dire que la fonction calcule le test sur l’ensemble du tableau.
nan_policy Il détermine comment traiter quand il y a des valeurs NaN dans les données d’entrée. Il y a trois paramètres de décision dans le paramètre, propagate, raise, omit. propagate renvoie simplement la valeur NaN, raise renvoie une erreur et omit ignore simplement les valeurs NaN et la fonction continue le calcul. Ces paramètres de décision sont définis entre guillemets simples ''. De plus, la valeur par défaut est propagate.

Tous les paramètres sauf le paramètre a (array) sont optionnels. Cela signifie qu’il n’est pas nécessaire de les définir à chaque fois que vous utilisez la fonction scipy.stats.normaltest.

Fonction scipy.stats.normaltest utilisant numpy.linspace()

La fonction linespace() de la bibliothèque NumPy aide à créer des séquences numériques aléatoires régulièrement espacées.

from scipy.stats import normaltest
import numpy as np
import pylab as p

a = np.linspace(-10, 10, 2000)
b = 1 / (np.sqrt(2 * np.pi)) * np.exp(-0.8 * (a) ** 2)

p.plot(a, b, "*")

print("Normal test of the data = \n ", normaltest(b))

Production :

statistiques scipy test normal

Fonction scipy.stats.normaltest utilisant des données aléatoires

La fonction np.random.normal de la bibliothèque NumPy est utilisée dans cette méthode. Cette fonction aide à créer un tableau d’une forme et d’une taille spécifiées qui se compose de valeurs aléatoires qui font en fait partie de la distribution gaussienne.

from scipy.stats import normaltest
import numpy as np

n = np.random.normal(0, 10, 10000)

print("N : ", n)

print("Normal test for input data : ", normaltest(n))

Production :

N :  [ 3.66175422  6.36095281 -0.84266502 ... -3.8817569   2.72610919
  1.80849087]
Normal test for input data :  NormaltestResult(statistic=4.626780379099072, pvalue=0.09892530688176408)
Lakshay Kapoor avatar Lakshay Kapoor avatar

Lakshay Kapoor is a final year B.Tech Computer Science student at Amity University Noida. He is familiar with programming languages and their real-world applications (Python/R/C++). Deeply interested in the area of Data Sciences and Machine Learning.

LinkedIn

Article connexe - SciPy Stats