Fonction SciPy stats.kurtosis

Lakshay Kapoor 30 janvier 2023
  1. La fonction scipy.stats.kurtosis
  2. Exemple d’aplatissement
Fonction SciPy stats.kurtosis

Kurtosis dans les statistiques aide à trouver la différence entre la lourdeur des queues d’une distribution particulière et la lourdeur des queues d’une distribution normale d’une donnée donnée. Ainsi, cette mesure statistique permet d’identifier si les queues d’une distribution particulière consistent en une valeur extrême.

Parallèlement à cette mesure statistique, il existe une autre métrique connue sous le nom de kurtosis excessif. Cette mesure aide à comparer l’aplatissement d’une distribution particulière avec l’aplatissement d’une distribution normale. L’aplatissement excessif peut être calculé comme ci-dessous.

Excess Kurtosis = Kurtosis - 3

Il existe trois types de kurtosis. Le type de kurtosis est défini par l’excès de kurtosis d’une distribution spécifique.

  • Mésokurtique - Si une donnée donnée représente une distribution mésokurtique, elle montre un excès d’aplatissement nul ou proche de zéro. En d’autres termes, une donnée donnée suit une distribution mésokurtique si elle présente une distribution normale.
  • Leptokurtic - Leptokurtic montre un excès d’aplatissement positif. La distribution leptokurtique représente des queues très lourdes des deux côtés, ce qui dénote certaines valeurs à une distance inhabituelle d’autres valeurs dans les données, également appelées outliers.
  • Platykurtic - La distribution platykurtique représente un excès d’aplatissement négatif. Le kurtosis montre une distribution qui a des queues plates. Les queues plates dans une distribution indiquent la présence de petites valeurs aberrantes.

La fonction scipy.stats.kurtosis

La fonction scipy.stats.kurtosis de la bibliothèque SciPy aide à calculer le kurtosis d’un jeu de données donné.

Syntaxe

scipy.stats.kurtosis(a, axis=0, fisher=True, bias=True, nan_policy="raise")

Paramètres

a (tableau) Il définit les données d’entrée pour lesquelles le kurtosis est calculé.
axis (int) Il définit l’axe le long duquel le kurtosis des données d’entrée est calculé. La valeur par défaut de ce paramètre est 0. Si la valeur est None, alors la fonction calcule simplement sur l’ensemble des données d’entrée.
fisher (bool) Un paramètre booléen. Si la valeur de ce paramètre est True, alors la définition de Fisher, c’est-à-dire normal ==> 0.0 est utilisée. Et si la valeur de ce paramètre est False, alors la définition de Pearson, c’est-à-dire normal ==> 3.0, est utilisée.
bias (bool) Il s’agit également d’un paramètre booléen. Si la valeur de ce paramètre est False, alors tous les calculs sont corrigés pour le biais statistique.
nan_policy Ce paramètre décide de la façon de gérer les valeurs NaN dans les données d’entrée. Il y a trois paramètres de décision dans le paramètre, propagate, raise, omit. propagate renvoie simplement la valeur NaN, raise renvoie une erreur et omit ignore simplement les valeurs NaN et la fonction continue le calcul. Ces paramètres de décision sont définis entre guillemets simples ''. La valeur par défaut de ce paramètre est propagate.

Exemple d’aplatissement

from scipy.stats import kurtosis
import numpy as np
import pylab as p

a = np.linspace(-10, 10, 2000)
b = 1 / (np.sqrt(2 * np.pi)) * np.exp(-0.5 * (a) ** 2)

p.plot(a, b, ".")

print("Kurtosis value for the given normal distribution :", kurtosis(b))

print("Kurtosis value for the given normal distribution :", kurtosis(b, fisher=False))

print(
    "Kurtosis value for the given normal distribution :",
    kurtosis(b, fisher=True, bias=False),
)

Production :

statistiques scipy kurtosis

Kurtosis value for the given normal distribution : 3.399361267205304
Kurtosis value for the given normal distribution : 6.399361267205304
Kurtosis value for the given normal distribution : 3.4108810035523636
Lakshay Kapoor avatar Lakshay Kapoor avatar

Lakshay Kapoor is a final year B.Tech Computer Science student at Amity University Noida. He is familiar with programming languages and their real-world applications (Python/R/C++). Deeply interested in the area of Data Sciences and Machine Learning.

LinkedIn

Article connexe - SciPy Stats