Función SciPy stats.sem

Lakshay Kapoor 30 enero 2023
  1. La función scipy.stats.sem
  2. Ejemplo de error estándar de la media
Función SciPy stats.sem

SEM en estadística significa Error estándar de la media. SEM se calcula calculando la desviación estándar de los datos dados y luego dividiéndola por la raíz cuadrada del tamaño de los datos dados. Este error estándar ayuda a determinar la precisión de la media aritmética de los datos de la muestra. Esto se hace averiguando la variabilidad entre cada muestra en los datos dados.

Entonces, a medida que aumenta el tamaño de los datos de muestra dados, el valor de SEM disminuye.

La función scipy.stats.sem

La función scipy.stats.sem de la biblioteca SciPy ayuda a calcular el SEM, es decir, el Error Medio Estándar de los datos de entrada dados.

Sintaxis

scipy.stats.sem(a, axis=0, ddof=0, nan_policy="propagate")

Parámetro

a (array) Este parámetro define los datos de entrada para los que se calcula el valor SEM.
axis (int) Este parámetro define el eje a lo largo del cual se calcula el valor SEM de los datos de entrada. El valor por defecto de este parámetro es 0. Si el valor es None, entonces la función simplemente calcula sobre todos los datos de entrada.
ddof (int) ddof significa grados de libertad delta. Este parámetro define el número de grados de libertad que ayuda a ajustar el sesgo con muestras de entrada limitadas en relación con la varianza de la población. El valor por defecto de este parámetro es 1.
nan_policy Este parámetro decide cómo tratar cuando hay valores NaN en los datos de entrada. Hay tres parámetros de decisión en el parámetro, propagate, raise, omit. El parámetro propagate simplemente devuelve el valor NaN, raise devuelve un error y omit simplemente ignora los valores NaN y la función continúa con el cálculo. Estos parámetros de decisión se definen entre comillas simples ''. El valor por defecto de este parámetro es propagate.

Todos los parámetros excepto el parámetro a (array) son opcionales. Esto significa que no es necesario definir todos los parámetros cada vez que se utiliza esta función.

Ejemplo de error estándar de la media

import numpy as np
from scipy import stats

array_1 = [[15, 12, 17, 11, 4], [43, 5, 2, 36, 21]]

array_2 = [23, 35, 14, 11, 2]

print("array 1 : ", array_1)
print("array 2 : ", array_2)

print("SEM for array 1 : ", stats.sem(array_1, axis=1, ddof=1))

print("SEM for array 2 : ", stats.sem(array_2, axis=0, ddof=0))

Producción:

array 1 :  [[15, 12, 17, 11, 4], [43, 5, 2, 36, 21]]
array 2 :  [23, 35, 14, 11, 2]
SEM for array 1 :  [2.22261108 8.14002457]
SEM for array 2 :  5.019960159204453
Lakshay Kapoor avatar Lakshay Kapoor avatar

Lakshay Kapoor is a final year B.Tech Computer Science student at Amity University Noida. He is familiar with programming languages and their real-world applications (Python/R/C++). Deeply interested in the area of Data Sciences and Machine Learning.

LinkedIn

Artículo relacionado - SciPy Stats