Pandas DataFrame DataFrame.median()関数
胡金庫
2023年1月30日
Pandas
Pandas DataFrame
-
pandas.DataFrame.median()の構文: -
コード例:列軸に沿って中央値を検索するための
DataFrame.median()メソッド -
コード例:行軸に沿って中央値を検索するための
DataFrame.median()メソッド -
コード例:
NaN値を無視して中央値を求めるDataFrame.median()メソッド
Python Pandas DataFrame.median() 関数は、DataFrame オブジェクトの要素の中央値を計算します指定された軸。
中央値は平均値ではなく、数値リストの値の中央です。
pandas.DataFrame.median() の構文:
DataFrame.median(axis=None, skipna=None, level=None, numeric_only=None, **kwargs)
パラメーター
axis |
行(axis = 0)または列(axis = 1)に沿って中央値を求める |
skipna |
ブール。NaN 値を除外する(skipna=True)または NaN 値を含める(skipna=False) |
level |
軸が MultiIndex の場合、特定のレベルとともにカウントします |
numeric_only |
ブール。numeric_only = True の場合、float、int、および boolean 列のみを含めます |
**kwargs |
関数への追加のキーワード引数。 |
戻り値
level が指定されていない場合、要求された軸の値の中央値の Series を返し、それ以外の場合は中央値の DataFrame を返します。
コード例:列軸に沿って中央値を検索するための DataFrame.median() メソッド
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 7, 5, 10],
'Y': [4, 3, 8, 2, 9]})
print("DataFrame:")
print(df)
medians=df.median()
print("medians of Each Column:")
print(medians)
出力:
DataFrame:
X Y
0 1 4
1 2 3
2 7 8
3 5 2
4 10 9
medians of Each Column:
X 5.0
Y 4.0
dtype: float64
X と Y の両方の列の中央値を計算し、最後に各列の中央値を持つ Series オブジェクトを返します。
Pandas で DataFrame の特定の列の中央値を求めるには、その列に対してのみ median() 関数を呼び出します。
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 7, 5, 10],
'Y': [4, 3, 8, 2, 9]})
print("DataFrame:")
print(df)
medians=df["X"].median()
print("medians of Each Column:")
print(medians)
出力:
DataFrame:
X Y
0 1 4
1 2 3
2 7 8
3 5 2
4 10 9
medians of Each Column:
5.0
DataFrame の X 列の値の中央値のみを示します。
コード例:行軸に沿って中央値を検索するための DataFrame.median() メソッド
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 7, 5, 10],
'Y': [4, 3, 8, 2, 9],
'Z': [2, 7, 6, 10, 5]})
print("DataFrame:")
print(df)
medians=df.median(axis=1)
print("medians of Each Row:")
print(medians)
出力:
DataFrame:
X Y Z
0 1 4 2
1 2 3 7
2 7 8 6
3 5 2 10
4 10 9 5
medians of Each Row:
0 2.0
1 3.0
2 7.0
3 5.0
4 9.0
dtype: float64
すべての行の中央値を計算し、最後に各行の中央値を持つ Series オブジェクトを返します。
Pandas の DataFrame の特定の行の中央値を求めるには、その行に対してのみ median() 関数を呼び出します。
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 7, 5, 10],
'Y': [4, 3, 8, 2, 9],
'Z': [2, 7, 6, 10, 5]})
print("DataFrame:")
print(df)
median=df.iloc[[0]].median(axis=1)
print("median of 1st Row:")
print(median)
出力:
DataFrame:
X Y Z
0 1 4 2
1 2 3 7
2 7 8 6
3 5 2 10
4 10 9 5
median of 1st Row:
0 2.0
dtype: float64
DataFrame の 1 行目の値の中央値のみを示します。
インデックスに基づいて行を選択するには、iloc メソッドを使用します。
コード例:NaN 値を無視して中央値を求める DataFrame.median() メソッド
skipna パラメータのデフォルト値、つまり skipna=True を使用して、NaN 値を無視することにより、指定された軸に沿った DataFrame の中央値を見つけます。
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 7, None, 10, 8],
'Y': [None, 3, 8, 2, 9, 6],
'Z': [2, 7, 6, 10, None, 5]})
print("DataFrame:")
print(df)
median=df.median(skipna=True)
print("medians of Each Row:")
print(median)
出力:
DataFrame:
X Y Z
0 1.0 NaN 2.0
1 2.0 3.0 7.0
2 7.0 8.0 6.0
3 NaN 2.0 10.0
4 10.0 9.0 NaN
5 8.0 6.0 5.0
medians of Each Row:
X 7.0
Y 6.0
Z 6.0
dtype: float64
skipna = True を設定すると、DataFrame の NaN は無視されます。NaN 値を無視することで、列軸に沿った DataFrame の中央値を計算できます。
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 7, None, 10],
'Y': [5, 3, 8, 2, 9],
'Z': [2, 7, 6, 10, 4]})
print("DataFrame:")
print(df)
median=df.median(skipna=False)
print("medians of Each Row:")
print(median)
出力:
DataFrame:
X Y Z
0 1.0 5 2
1 2.0 3 7
2 7.0 8 6
3 NaN 2 10
4 10.0 9 4
medians of Each Row:
X NaN
Y 5.0
Z 6.0
dtype: float64
ここでは、列 X に NaN 値が存在するため、列 X の中央値の NaN 値を取得します。
チュートリアルを楽しんでいますか? <a href="https://www.youtube.com/@delftstack/?sub_confirmation=1" style="color: #a94442; font-weight: bold; text-decoration: underline;">DelftStackをチャンネル登録</a> して、高品質な動画ガイドをさらに制作するためのサポートをお願いします。 Subscribe
著者: 胡金庫
