SciPy stats.sem 関数

Lakshay Kapoor 2023年1月30日 2022年1月30日
  1. scipy.stats.sem 関数
  2. 平均の標準誤差の例
SciPy stats.sem 関数

統計の SEM平均の標準誤差を表します。SEM は、指定されたデータの標準偏差を計算し、それを指定されたデータのサイズの平方根で割ることによって計算されます。この標準誤差は、サンプルデータの算術平均の精度を求めるのに役立ちます。これは、与えられたデータの各サンプル間の変動性を求めることによって行われます。

したがって、指定されたサンプルデータのサイズが大きくなると、SEM の値は小さくなります。

scipy.stats.sem 関数

SciPy ライブラリの scipy.stats.sem 関数は、指定された入力データの SEM、つまり標準平均誤差を計算するのに役立ちます。

構文

scipy.stats.sem(a, 
               axis = 0,
               ddof = 0,
               nan_policy = 'propagate')

パラメータ

a(配列) このパラメーターは、SEM 値が計算される入力データを定義します。
axis(int) このパラメータは、入力データの SEM 値が計算される軸を定義します。このパラメータのデフォルト値は 0 です。値が None の場合、関数は入力データ全体を計算するだけです。
ddof (int) ddofDelta degrees-of-freedom の略です。このパラメーターは、母集団の分散に対して限られた入力サンプルでバイアスを調整するのに役立つ自由度の数を定義します。このパラメータのデフォルト値は 1 です。
nan_policy このパラメーターは、入力データに NaN 値がある場合の処理​​方法を決定します。パラメータには、propagateraiseomit の 3つの決定パラメータがあります。propagate は単に NaN 値を返し、raise はエラーを返し、omit は単に NaN 値を無視し、関数は計算を続行します。これらの決定パラメータは一重引用符''で定義されます。このパラメータのデフォルト値は propagate です。

a(配列) パラメーターを除くすべてのパラメーターはオプションです。これは、この関数を使用するたびにすべてのパラメーターを定義する必要がないことを意味します。

平均の標準誤差の例

import numpy as np
from scipy import stats
   
array_1 = [[15, 12, 17, 11, 4],
        [43, 5, 2, 36, 21]]
  
array_2 = [23, 35, 14, 11, 2]
  
print ("array 1 : ", array_1)
print ("array 2 : ", array_2)
  
print ("SEM for array 1 : ", 
       stats.sem(array_1, axis = 1, ddof = 1))
  
print ("SEM for array 2 : ", 
       stats.sem(array_2, axis = 0, ddof = 0))

出力:

array 1 :  [[15, 12, 17, 11, 4], [43, 5, 2, 36, 21]]
array 2 :  [23, 35, 14, 11, 2]
SEM for array 1 :  [2.22261108 8.14002457]
SEM for array 2 :  5.019960159204453
Lakshay Kapoor avatar Lakshay Kapoor avatar

Lakshay Kapoor is a final year B.Tech Computer Science student at Amity University Noida. He is familiar with programming languages and their real-world applications (Python/R/C++). Deeply interested in the area of Data Sciences and Machine Learning.

LinkedIn

関連記事 - SciPy Stats