Pandas DataFrame DataFrame.median() Função
-
Sintaxe de
pandas.DataFrame.median(): -
Códigos de exemplo:
DataFrame.median()Método para encontrar a mediana ao longo do eixo da coluna -
Códigos de exemplo:
DataFrame.median()Método para encontrar a mediana ao longo do eixo da linha -
Códigos de exemplo:
DataFrame.median()Método para encontrar a mediana ignorando os valoresNaN
A função Python Pandas DataFrame.median() calcula a mediana dos elementos do objeto DataFrame ao longo do eixo especificado.
A mediana não é mean, mas o meio dos valores na lista de números.
Sintaxe de pandas.DataFrame.median():
DataFrame.median(axis=None, skipna=None, level=None, numeric_only=None, **kwargs)
Parâmetros
axis |
encontrar mediana ao longo da linha (axis=0) ou coluna (axis=1) |
skipna |
Booleano. Excluir valores NaN (skipna=True) ou incluir valores NaN (skipna=False) |
level |
Conte junto com um nível particular se o eixo for MultiIndex. |
numeric_only |
Booleano. Para colunas numeric_only=True, incluir apenas colunas float, int, e boolean. |
**kwargs |
Argumentos adicionais de palavras-chave para a função. |
Retornar
Se o level não for especificado, retornar Series da mediana dos valores para o eixo solicitado, caso contrário, retornar DataFrame dos valores da mediana.
Códigos de exemplo: DataFrame.median() Método para encontrar a mediana ao longo do eixo da coluna
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 7, 5, 10],
'Y': [4, 3, 8, 2, 9]})
print("DataFrame:")
print(df)
medians=df.median()
print("medians of Each Column:")
print(medians)
Resultado:
DataFrame:
X Y
0 1 4
1 2 3
2 7 8
3 5 2
4 10 9
medians of Each Column:
X 5.0
Y 4.0
dtype: float64
Ele calcula a mediana para ambas as colunas X e Y e finalmente retorna um objeto Series com a mediana de cada coluna.
Para encontrar a mediana de uma coluna específica de DataFrame em Pandas, chamamos a função median() somente para aquela coluna.
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 7, 5, 10],
'Y': [4, 3, 8, 2, 9]})
print("DataFrame:")
print(df)
medians=df["X"].median()
print("medians of Each Column:")
print(medians)
Resultado:
DataFrame:
X Y
0 1 4
1 2 3
2 7 8
3 5 2
4 10 9
medians of Each Column:
5.0
Ela fornece apenas a mediana dos valores da coluna X de DataFrame.
Códigos de exemplo: DataFrame.median() Método para encontrar a mediana ao longo do eixo da linha
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 7, 5, 10],
'Y': [4, 3, 8, 2, 9],
'Z': [2, 7, 6, 10, 5]})
print("DataFrame:")
print(df)
medians=df.median(axis=1)
print("medians of Each Row:")
print(medians)
Resultado:
DataFrame:
X Y Z
0 1 4 2
1 2 3 7
2 7 8 6
3 5 2 10
4 10 9 5
medians of Each Row:
0 2.0
1 3.0
2 7.0
3 5.0
4 9.0
dtype: float64
Ele calcula a mediana de todas as linhas e finalmente retorna um objeto Series com a mediana de cada linha.
Para encontrar a mediana de uma determinada linha de DataFrame em Pandas, chamamos a função median() somente para essa linha.
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 7, 5, 10],
'Y': [4, 3, 8, 2, 9],
'Z': [2, 7, 6, 10, 5]})
print("DataFrame:")
print(df)
median=df.iloc[[0]].median(axis=1)
print("median of 1st Row:")
print(median)
Resultado:
DataFrame:
X Y Z
0 1 4 2
1 2 3 7
2 7 8 6
3 5 2 10
4 10 9 5
median of 1st Row:
0 2.0
dtype: float64
Ela fornece apenas a mediana dos valores da 1ª linha de DataFrame.
Utilizamos o método iloc para selecionar linhas com base no índice.
Códigos de exemplo: DataFrame.median() Método para encontrar a mediana ignorando os valores NaN
Utilizamos o valor padrão do parâmetro skipna, ou seja, skipna=True para encontrar a mediana de DataFrame ao longo do eixo especificado, ignorando os valores NaN.
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 7, None, 10, 8],
'Y': [None, 3, 8, 2, 9, 6],
'Z': [2, 7, 6, 10, None, 5]})
print("DataFrame:")
print(df)
median=df.median(skipna=True)
print("medians of Each Row:")
print(median)
Resultado:
DataFrame:
X Y Z
0 1.0 NaN 2.0
1 2.0 3.0 7.0
2 7.0 8.0 6.0
3 NaN 2.0 10.0
4 10.0 9.0 NaN
5 8.0 6.0 5.0
medians of Each Row:
X 7.0
Y 6.0
Z 6.0
dtype: float64
Se definirmos skipna=True, ele ignora a NaN no campo de dados. Isto nos permite calcular a mediana de DataFrame ao longo do eixo da coluna, ignorando os valores NaN.
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 7, None, 10],
'Y': [5, 3, 8, 2, 9],
'Z': [2, 7, 6, 10, 4]})
print("DataFrame:")
print(df)
median=df.median(skipna=False)
print("medians of Each Row:")
print(median)
Resultado:
DataFrame:
X Y Z
0 1.0 5 2
1 2.0 3 7
2 7.0 8 6
3 NaN 2 10
4 10.0 9 4
medians of Each Row:
X NaN
Y 5.0
Z 6.0
dtype: float64
Aqui, obtemos o valor NaN para a mediana da coluna X, pois a coluna X tem o valor NaN presente nela.
Founder of DelftStack.com. Jinku has worked in the robotics and automotive industries for over 8 years. He sharpened his coding skills when he needed to do the automatic testing, data collection from remote servers and report creation from the endurance test. He is from an electrical/electronics engineering background but has expanded his interest to embedded electronics, embedded programming and front-/back-end programming.
LinkedIn Facebook