Función SciPy scipy.stats.sem

Bhuwan Bhatt 30 enero 2023
  1. Sintaxis de scipy.stats.sem():
  2. Códigos de ejemplo: scipy.stats.sem() Método para encontrar la media sin conjunto de ejes
  3. Códigos de ejemplo: Establezca axis=None en la función scipy.stats.sem()
  4. Códigos de ejemplo: Establezca axis=1 en la función scipy.stats.sem()
  5. Códigos de ejemplo: establecer ddof=0 en la función scipy.stats.sem()
Función SciPy scipy.stats.sem

La función Python Scipy scipy.stats.sem() calcula el error estándar de la media de los datos proporcionados. El error estándar de la media nos muestra qué tan lejos está la media muestreada de la media de la población real.

Sintaxis de scipy.stats.sem():

scipy.stats.sem(a, axis=0, ddof=1)

Parámetros

a Una matriz que tiene elementos cuyo error estándar se va a calcular.
axis Un parámetro opcional. El eje a lo largo del cual se calculará el error estándar de la media. Por defecto, axis=0(eje horizontal)
ddof Un parámetro opcional. Representa el grado de libertad que es igual al tamaño de la muestra menos el número de parámetros que deben calcularse durante la operación. Su valor por defecto es 1.

Regreso

Devuelve el error estándar de la media. El valor puede ser un array de elementos o un solo número flotante en función de los parámetros y el grado de libertad utilizados.

Códigos de ejemplo: scipy.stats.sem() Método para encontrar la media sin conjunto de ejes

import numpy as np
import scipy
from scipy import stats

arr = np.array([[2, 5, 6, 8], [3, 7, 3, 0], [1, 1, 4, 4], [9, 5, 0, 5], [6, 4, 2, 2]])


result = scipy.stats.sem(arr)
print("The standard error of given data is:\n", result)

Producción:

The standard error of given data is:
 [1.46287388 0.9797959  1.         1.356466  ]

Aquí, se crea un array arr con datos multidimensionales. La matriz se pasa como argumento a la función stats.sem, que produce la salida, y se almacena en la variable resultado.

Dado que no se define ningún parámetro de eje en esta condición, la operación media tiene lugar en el eje horizontal por defecto.
Cada uno de los cinco elementos de la columna se trata a la vez. Al principio, se calcula su desviación estándar y luego se usa la fórmula del error estándar. Por ejemplo, el primer elemento en el valor de la matriz de salida 1.46287388 es el resultado del primer elemento de la columna 2, 3, 1, 9, 6.

Códigos de ejemplo: Establezca axis=None en la función scipy.stats.sem()

import numpy as np
import scipy
from scipy import stats

arr = np.array([[2, 5, 6, 8], [3, 7, 3, 0], [1, 1, 4, 4], [9, 5, 0, 5], [6, 4, 2, 2]])

result = scipy.stats.sem(arr, axis=None)
print("The standard error of given data is:\n", result)

Producción:

The standard error of given data is:
 0.5725060330640515

Aquí, la salida muestra un solo valor flotante porque cada vez que el eje se establece en None, la operación se lleva a cabo en todo el elemento de la matriz en lugar de en un campo de fila o columna en particular.

Códigos de ejemplo: Establezca axis=1 en la función scipy.stats.sem()

import numpy as np
import scipy
from scipy import stats

arr = np.array([[2, 5, 6, 8], [3, 7, 3, 0], [1, 1, 4, 4], [9, 5, 0, 5], [6, 4, 2, 2]])


result = scipy.stats.sem(arr, axis=1)
print("The standard error of given data is:\n", result)

Producción:

The standard error of given data is:
 [1.25       1.43614066 0.8660254  1.8427787  0.95742711]

Aquí, el eje se establece en 1, lo que significa que la operación tomará el eje vertical, produciendo así cinco elementos en el campo de matriz de salida.

Códigos de ejemplo: establecer ddof=0 en la función scipy.stats.sem()

import numpy as np
import scipy
from scipy import stats

arr = np.array([[2, 5, 6, 8], [3, 7, 3, 0], [1, 1, 4, 4], [9, 5, 0, 5], [6, 4, 2, 2]])

result = scipy.stats.sem(arr, axis=1, ddof=0)
print("The standard error of given data is:\n", result)

Producción:

The standard error of given data is:
 [1.08253175 1.2437343  0.75       1.59589317 0.8291562 ]

Aquí, la operación del eje es similar al ejemplo anterior, pero ddof=0 trae algunos cambios. Sabemos que antes de calcular el error estándar, necesitamos tener el valor de las desviaciones estándar. Para calcular la desviación estándar, la media de las diferencias al cuadrado se evalúa utilizando número de tamaño de muestra menos ddof. Así, por defecto, el valor de ddof es 1, pero siempre que se mantenga en 0, el valor de errores estándar disminuye.

Cada vez que los datos de la muestra crecen, el error estándar de la media disminuye en referencia a la desviación estándar. Es decir, con datos de muestra más grandes, la media de la muestra calcula la media de la población real con mayor precisión y precisión.

Artículo relacionado - SciPy Stats