Función Pandas DataFrame DataFrame.mean()
-
Sintaxis de
pandas.DataFrame.mean(): -
Códigos de ejemplo:
DataFrame.mean()Método para encontrar la media a lo largo del eje de la columna -
Códigos de ejemplo:
DataFrame.mean()Método para encontrar la media a lo largo del eje de la fila -
Códigos de ejemplo:
DataFrame.mean()Método para encontrar la media ignorando los valoresNaN
La función Python Pandas DataFrame.mean() calcula la media de valores del objeto DataFrame sobre el eje especificado.
Sintaxis de pandas.DataFrame.mean():
DataFrame.mean(axis=None, skipna=None, level=None, numeric_only=None, **kwargs)
Parámetros
axis |
encontrar la media a lo largo de la fila (axis=0) o fila (axis=1) |
skipna |
Booleana. Excluir los valores NaN (skipna=True) o incluir los valores NaN (skipna=False) |
level |
Cuenta junto con el nivel particular si el eje es MultiIndex. |
numeric_only |
Booleana. Para numeric_only = True, incluye sólo las columnas float, int y boolean. |
**kwargs |
Argumentos de palabras clave adicionales a la función. |
Retorna
Si no se especifica el level, devuelve Series de la media de los valores del eje solicitado, si no, devuelve DataFrame de los valores medios.
Códigos de ejemplo: DataFrame.mean() Método para encontrar la media a lo largo del eje de la columna
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 2, 3],
'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)
means=df.mean()
print("Means of Each Column:")
print(means)
Resultado:
DataFrame:
X Y
0 1 4
1 2 3
2 2 8
3 3 4
Means of Each Column:
X 2.00
Y 4.75
dtype: float64
Calcula la media de ambas columnas X y Y y finalmente devuelve un objeto Series con la media de cada columna.
Para encontrar la media de una columna particular de DataFrame en Pandas, llamamos a la función mean() para esa columna solamente.
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 2, 3],
'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)
means=df["X"].mean()
print("Mean of Column X:")
print(means)
Resultado:
DataFrame:
X Y
0 1 4
1 2 3
2 2 8
3 3 4
Mean of Column X:
2.0
Sólo da la media de los valores de la columna X de DataFrame.
Códigos de ejemplo: DataFrame.mean() Método para encontrar la media a lo largo del eje de la fila
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 2, 3],
'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)
means=df.mean(axis=1)
print("Mean of Rows:")
print(means)
Resultado:
DataFrame:
X Y
0 1 4
1 2 3
2 2 8
3 3 4
Mean of Rows:
0 2.5
1 2.5
2 5.0
3 3.5
dtype: float64
Calcula la media de todas las filas y finalmente devuelve un objeto Series con la media de cada fila.
Para encontrar la media de una fila particular de DataFrame en Pandas, llamamos a la función mean() para esa fila solamente.
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 2, 3],
'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)
mean=df.iloc[[0]].mean(axis=1)
print("Mean of 1st Row:")
print(mean)
Resultado:
DataFrame:
X Y
0 1 4
1 2 3
2 2 8
3 3 4
Mean of 1st Row:
0 2.5
dtype: float64
Sólo da la media de los valores de la primera fila de DataFrame.
Usamos el método iloc para seleccionar filas basadas en el índice.
Códigos de ejemplo: DataFrame.mean() Método para encontrar la media ignorando los valores NaN
Usamos el valor por defecto del parámetro skipna, es decir, skipna=True para encontrar la media de DataFrame a lo largo del eje especificado ignorando los valores NaN.
import pandas as pd
df = pd.DataFrame({'X': [1, 2, None, 3],
'Y': [4, 3, None, 4]})
print("DataFrame:")
print(df)
means=df.mean(skipna=True)
print("Mean of Columns")
print(means)
Resultado:
DataFrame:
X Y
0 1.0 4.0
1 2.0 3.0
2 NaN NaN
3 3.0 4.0
Mean of Columns
X 2.000000
Y 3.666667
dtype: float64
Si establecemos skipna=True, ignora el NaN en el dataframe. Nos permite calcular la media del DataFrame a lo largo del eje de la columna ignorando los valores NaN.
import pandas as pd
df = pd.DataFrame({'X': [1, 2, None, 3],
'Y': [4, 3, 3, 4]})
print("DataFrame:")
print(df)
means=df.mean(skipna=False)
print("Mean of Columns")
print(means)
Resultado:
DataFrame:
X Y
0 1.0 4
1 2.0 3
2 NaN 3
3 3.0 4
Mean of Columns
X NaN
Y 3.5
dtype: float64
Aquí, obtenemos el valor NaN para la media de la columna X, ya que la columna X tiene el valor NaN presente en ella.
Suraj Joshi is a backend software engineer at Matrice.ai.
LinkedIn