SciPy stats.sem Funktion
 
SEM steht in der Statistik für Standard Error of the Mean. SEM wird berechnet, indem die Standardabweichung der gegebenen Daten berechnet und dann durch die Quadratwurzel der Größe der gegebenen Daten dividiert wird. Dieser Standardfehler hilft dabei, die Genauigkeit des arithmetischen Mittels der Stichprobendaten herauszufinden. Dies geschieht, indem die Variabilität zwischen den einzelnen Proben in den gegebenen Daten ermittelt wird.
Mit zunehmender Größe der gegebenen Stichprobendaten nimmt also der Wert des SEM ab.
Die scipy.stats.sem Funktion
    
Die Funktion scipy.stats.sem der Bibliothek SciPy hilft bei der Berechnung des SEM, d.h. Standard Mean Error der gegebenen Eingabedaten.
Syntax
scipy.stats.sem(a, axis=0, ddof=0, nan_policy="propagate")
Parameter
| a (Array) | Dieser Parameter definiert die Eingangsdaten, für die der SEM-Wert berechnet wird. | |
| axis (int) | Dieser Parameter definiert die Achse, entlang der der SEM-Wert der Eingabedaten berechnet wird. Der Standardwert dieses Parameters ist0. Wenn der WertNoneist, dann rechnet die Funktion einfach über die gesamten Eingabedaten. | |
| ddof (int) | ddofsteht fürDelta-Freiheitsgrade. Dieser Parameter definiert die Anzahl der Freiheitsgrade, die bei der Anpassung der Verzerrung mit begrenzten Eingabestichproben relativ zur Varianz der Grundgesamtheit hilfreich sind. Der Standardwert dieses Parameters ist1. | |
| nan_policy | Dieser Parameter entscheidet, wie mit NaN-Werten in den Eingabedaten umgegangen wird. Im Parameter gibt es drei Entscheidungsparameter, propagate,raise,omit.propagategibt einfach den NaN-Wert zurück,raisegibt einen Fehler zurück undomitignoriert einfach die NaN-Werte und die Funktion fährt mit der Berechnung fort. Diese Entscheidungsparameter werden in einfachen Anführungszeichen''definiert. Der Standardwert dieses Parameters istpropagate. | 
Alle Parameter außer dem Parameter a (array) sind optional. Das bedeutet, dass bei Verwendung dieser Funktion nicht alle Parameter definiert werden müssen.
Beispiel für Standardfehler des Mittelwerts
import numpy as np
from scipy import stats
array_1 = [[15, 12, 17, 11, 4], [43, 5, 2, 36, 21]]
array_2 = [23, 35, 14, 11, 2]
print("array 1 : ", array_1)
print("array 2 : ", array_2)
print("SEM for array 1 : ", stats.sem(array_1, axis=1, ddof=1))
print("SEM for array 2 : ", stats.sem(array_2, axis=0, ddof=0))
Ausgabe:
array 1 :  [[15, 12, 17, 11, 4], [43, 5, 2, 36, 21]]
array 2 :  [23, 35, 14, 11, 2]
SEM for array 1 :  [2.22261108 8.14002457]
SEM for array 2 :  5.019960159204453
Lakshay Kapoor is a final year B.Tech Computer Science student at Amity University Noida. He is familiar with programming languages and their real-world applications (Python/R/C++). Deeply interested in the area of Data Sciences and Machine Learning.
LinkedIn