Fonction SciPy stats.sem

Lakshay Kapoor 30 janvier 2023
  1. La fonction scipy.stats.sem
  2. Exemple d’erreur standard de la moyenne
Fonction SciPy stats.sem

SEM dans les statistiques signifie Standard Error of the Mean. SEM est calculé en calculant l’écart type des données données, puis en le divisant par la racine carrée de la taille des données données. Cette erreur standard aide à déterminer l’exactitude de la moyenne arithmétique des données de l’échantillon. Cela se fait en découvrant la variabilité entre chaque échantillon dans les données données.

Ainsi, à mesure que la taille des données d’échantillon données augmente, la valeur du SEM diminue.

La fonction scipy.stats.sem

La fonction scipy.stats.sem de la bibliothèque SciPy permet de calculer le SEM c’est à dire le Standard Mean Error des données d’entrée données.

Syntaxe

scipy.stats.sem(a, axis=0, ddof=0, nan_policy="propagate")

Paramètre

a (tableau) Ce paramètre définit les données d’entrée pour lesquelles la valeur SEM est calculée.
axis (entier) Ce paramètre définit l’axe selon lequel la valeur SEM des données d’entrée est calculée. La valeur par défaut de ce paramètre est 0. Si la valeur est None, alors la fonction calcule simplement sur l’ensemble des données d’entrée.
ddof (entier) ddof est l’abréviation de Delta degrees-of-freedom. Ce paramètre définit le nombre de degrés de liberté qui aide à ajuster le biais avec des échantillons d’entrée limités par rapport à la variance de la population. La valeur par défaut de ce paramètre est 1.
nan_policy Ce paramètre décide de la façon de gérer les valeurs NaN dans les données d’entrée. Il y a trois paramètres de décision dans le paramètre, propagate, raise, omit. propagate renvoie simplement la valeur NaN, raise renvoie une erreur et omit ignore simplement les valeurs NaN et la fonction continue le calcul. Ces paramètres de décision sont définis entre guillemets simples ''. La valeur par défaut de ce paramètre est propagate.

Tous les paramètres sauf le paramètre a (array) sont facultatifs. Cela signifie qu’il n’est pas nécessaire de définir tous les paramètres lors de l’utilisation de cette fonction.

Exemple d’erreur standard de la moyenne

import numpy as np
from scipy import stats

array_1 = [[15, 12, 17, 11, 4], [43, 5, 2, 36, 21]]

array_2 = [23, 35, 14, 11, 2]

print("array 1 : ", array_1)
print("array 2 : ", array_2)

print("SEM for array 1 : ", stats.sem(array_1, axis=1, ddof=1))

print("SEM for array 2 : ", stats.sem(array_2, axis=0, ddof=0))

Production :

array 1 :  [[15, 12, 17, 11, 4], [43, 5, 2, 36, 21]]
array 2 :  [23, 35, 14, 11, 2]
SEM for array 1 :  [2.22261108 8.14002457]
SEM for array 2 :  5.019960159204453
Lakshay Kapoor avatar Lakshay Kapoor avatar

Lakshay Kapoor is a final year B.Tech Computer Science student at Amity University Noida. He is familiar with programming languages and their real-world applications (Python/R/C++). Deeply interested in the area of Data Sciences and Machine Learning.

LinkedIn

Article connexe - SciPy Stats