Pandas DataFrame DataFrame.median() Funktion

Jinku Hu 30 Januar 2023
  1. Syntax von pandas.DataFrame.median():
  2. Beispielcodes: DataFrame.median() Methode zur Ermittlung des Medians entlang der Spaltenachse
  3. Beispielcodes: DataFrame.median() Methode zur Ermittlung des Medians entlang der Zeilenachse
  4. Beispiel-Codes: DataFrame.median() Methode, um den Median zu finden, der die NaN-Werte ignoriert
Pandas DataFrame DataFrame.median() Funktion

Die Funktion Python Pandas DataFrame.median() berechnet den Median der Elemente des DataFrame-Objekts entlang der angegebenen Achse.

Der Median ist nicht mean, sondern die Mitte der Werte in der Zahlenliste.

Pandas DataFrame-Median

Syntax von pandas.DataFrame.median():

DataFrame.median(axis=None, skipna=None, level=None, numeric_only=None, **kwargs)

Parameter

axis den Median entlang der row (axis=0) oder column (axis=1) finden
skipna Boolesch. Ausschließen von NaN-Werten (skipna=True) oder Einschließen von NaN-Werten (skipna=False)
level Zählen Sie mit einem bestimmten Pegel mit, wenn die Achse MultiIndex ist.
numeric_only Boolesch. Fügen Sie für numeric_only=True nur die Spalten float, int und boolean ein.
**kwargs Zusätzliche Schlüsselwort-Argumente zu der Funktion.

Zurück

Wenn der Level nicht angegeben ist, geben Sie Series des Medians der Werte für die angeforderte Achse zurück, andernfalls DataFrame der Medianwerte.

Beispielcodes: DataFrame.median() Methode zur Ermittlung des Medians entlang der Spaltenachse

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 7, 5, 10],
                   'Y': [4, 3, 8, 2, 9]})
print("DataFrame:")
print(df)

medians=df.median()
print("medians of Each Column:")
print(medians)

Ausgabe:

DataFrame:
    X  Y
0   1  4
1   2  3
2   7  8
3   5  2
4  10  9
medians of Each Column:
X    5.0
Y    4.0
dtype: float64

Es berechnet den Median für die beiden Spalten X und Y und gibt schließlich ein Series-Objekt mit dem Median jeder Spalte zurück.

Um den Median einer bestimmten Spalte von DataFrame in Pandas zu finden, rufen wir die median() Funktion nur für diese Spalte auf.

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 7, 5, 10],
                   'Y': [4, 3, 8, 2, 9]})
print("DataFrame:")
print(df)

medians=df["X"].median()
print("medians of Each Column:")
print(medians)

Ausgabe:

DataFrame:
    X  Y
0   1  4
1   2  3
2   7  8
3   5  2
4  10  9
medians of Each Column:
5.0

Sie gibt nur den Median der Werte der Spalte X von DataFrame aus.

Beispielcodes: DataFrame.median() Methode zur Ermittlung des Medians entlang der Zeilenachse

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 7, 5, 10],
                   'Y': [4, 3, 8, 2, 9],
                   'Z': [2, 7, 6, 10, 5]})
print("DataFrame:")
print(df)

medians=df.median(axis=1)
print("medians of Each Row:")
print(medians)

Ausgabe:

DataFrame:
    X  Y   Z
0   1  4   2
1   2  3   7
2   7  8   6
3   5  2  10
4  10  9   5
medians of Each Row:
0    2.0
1    3.0
2    7.0
3    5.0
4    9.0
dtype: float64

Es berechnet den Median für alle Zeilen und gibt schließlich ein Series-Objekt mit dem Median jeder Zeile zurück.

Um den Median einer bestimmten Zeile von DataFrame in Pandas zu finden, rufen wir die median() Funktion nur für diese Zeile auf.

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 7, 5, 10],
                   'Y': [4, 3, 8, 2, 9],
                   'Z': [2, 7, 6, 10, 5]})

print("DataFrame:")
print(df)

median=df.iloc[[0]].median(axis=1)
print("median of 1st Row:")
print(median)

Ausgabe:

DataFrame:
    X  Y   Z
0   1  4   2
1   2  3   7
2   7  8   6
3   5  2  10
4  10  9   5
median of 1st Row:
0    2.0
dtype: float64

Sie gibt nur den Median der Werte der ersten Zeile des DataFrame aus.

Wir benutzen die iloc Methode, um Zeilen basierend auf dem Index auszuwählen.

Beispiel-Codes: DataFrame.median() Methode, um den Median zu finden, der die NaN-Werte ignoriert

Wir verwenden den Standardwert des Parameters skipna, d.h. skipna=True, um den Median des DataFrame entlang der angegebenen Achse zu finden, indem wir die NaN-Werte ignorieren.

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 7, None, 10, 8],
                   'Y': [None, 3, 8, 2, 9, 6],
                   'Z': [2, 7, 6, 10, None, 5]})

print("DataFrame:")
print(df)

median=df.median(skipna=True)
print("medians of Each Row:")
print(median)

Ausgabe:

DataFrame:
      X    Y     Z
0   1.0  NaN   2.0
1   2.0  3.0   7.0
2   7.0  8.0   6.0
3   NaN  2.0  10.0
4  10.0  9.0   NaN
5   8.0  6.0   5.0
medians of Each Row:
X    7.0
Y    6.0
Z    6.0
dtype: float64

Wenn wir skipna=True setzen, ignoriert es die NaN im DataFrame. Es erlaubt uns, den Median des DataFrame entlang der Spaltenachse zu berechnen, indem wir NaN-Werte ignorieren.

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 7, None, 10],
                   'Y': [5, 3, 8, 2, 9],
                   'Z': [2, 7, 6, 10, 4]})

print("DataFrame:")
print(df)

median=df.median(skipna=False)
print("medians of Each Row:")
print(median)

Ausgabe:

DataFrame:
      X  Y   Z
0   1.0  5   2
1   2.0  3   7
2   7.0  8   6
3   NaN  2  10
4  10.0  9   4
medians of Each Row:
X    NaN
Y    5.0
Z    6.0
dtype: float64

Hier erhalten wir den NaN-Wert für den Median der Spalte X, da in Spalte X der NaN-Wert vorhanden ist.

Autor: Jinku Hu
Jinku Hu avatar Jinku Hu avatar

Founder of DelftStack.com. Jinku has worked in the robotics and automotive industries for over 8 years. He sharpened his coding skills when he needed to do the automatic testing, data collection from remote servers and report creation from the endurance test. He is from an electrical/electronics engineering background but has expanded his interest to embedded electronics, embedded programming and front-/back-end programming.

LinkedIn Facebook

Verwandter Artikel - Pandas DataFrame