Función Pandas DataFrame DataFrame.mean()

Suraj Joshi 30 enero 2023
  1. Sintaxis de pandas.DataFrame.mean():
  2. Códigos de ejemplo: DataFrame.mean() Método para encontrar la media a lo largo del eje de la columna
  3. Códigos de ejemplo: DataFrame.mean() Método para encontrar la media a lo largo del eje de la fila
  4. Códigos de ejemplo: DataFrame.mean() Método para encontrar la media ignorando los valores NaN
Función Pandas DataFrame DataFrame.mean()

La función Python Pandas DataFrame.mean() calcula la media de valores del objeto DataFrame sobre el eje especificado.

Sintaxis de pandas.DataFrame.mean():

DataFrame.mean(axis=None, skipna=None, level=None, numeric_only=None, **kwargs)

Parámetros

axis encontrar la media a lo largo de la fila (axis=0) o fila (axis=1)
skipna Booleana. Excluir los valores NaN (skipna=True) o incluir los valores NaN (skipna=False)
level Cuenta junto con el nivel particular si el eje es MultiIndex.
numeric_only Booleana. Para numeric_only = True, incluye sólo las columnas float, int y boolean.
**kwargs Argumentos de palabras clave adicionales a la función.

Retorna

Si no se especifica el level, devuelve Series de la media de los valores del eje solicitado, si no, devuelve DataFrame de los valores medios.

Códigos de ejemplo: DataFrame.mean() Método para encontrar la media a lo largo del eje de la columna

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 2, 3],
                   'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)

means=df.mean()
print("Means of Each Column:")
print(means)

Resultado:

DataFrame:
   X  Y
0  1  4
1  2  3
2  2  8
3  3  4
Means of Each Column:
X    2.00
Y    4.75
dtype: float64

Calcula la media de ambas columnas X y Y y finalmente devuelve un objeto Series con la media de cada columna.

Para encontrar la media de una columna particular de DataFrame en Pandas, llamamos a la función mean() para esa columna solamente.

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 2, 3],
                   'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)

means=df["X"].mean()
print("Mean of Column X:")
print(means)

Resultado:

DataFrame:
   X  Y
0  1  4
1  2  3
2  2  8
3  3  4
Mean of Column X:
2.0

Sólo da la media de los valores de la columna X de DataFrame.

Códigos de ejemplo: DataFrame.mean() Método para encontrar la media a lo largo del eje de la fila

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 2, 3],
                   'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)

means=df.mean(axis=1)
print("Mean of Rows:")
print(means)

Resultado:

DataFrame:
   X  Y
0  1  4
1  2  3
2  2  8
3  3  4
Mean of Rows:
0    2.5
1    2.5
2    5.0
3    3.5
dtype: float64

Calcula la media de todas las filas y finalmente devuelve un objeto Series con la media de cada fila.

Para encontrar la media de una fila particular de DataFrame en Pandas, llamamos a la función mean() para esa fila solamente.

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 2, 3],
                   'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)

mean=df.iloc[[0]].mean(axis=1)
print("Mean of 1st Row:")
print(mean)

Resultado:

DataFrame:
   X  Y
0  1  4
1  2  3
2  2  8
3  3  4
Mean of 1st Row:
0    2.5
dtype: float64

Sólo da la media de los valores de la primera fila de DataFrame.

Usamos el método iloc para seleccionar filas basadas en el índice.

Códigos de ejemplo: DataFrame.mean() Método para encontrar la media ignorando los valores NaN

Usamos el valor por defecto del parámetro skipna, es decir, skipna=True para encontrar la media de DataFrame a lo largo del eje especificado ignorando los valores NaN.

import pandas as pd

df = pd.DataFrame({'X': [1, 2, None, 3],
                   'Y': [4, 3, None, 4]})
print("DataFrame:")
print(df)

means=df.mean(skipna=True)
print("Mean of Columns")
print(means)

Resultado:

DataFrame:
     X    Y
0  1.0  4.0
1  2.0  3.0
2  NaN  NaN
3  3.0  4.0
Mean of Columns
X    2.000000
Y    3.666667
dtype: float64

Si establecemos skipna=True, ignora el NaN en el dataframe. Nos permite calcular la media del DataFrame a lo largo del eje de la columna ignorando los valores NaN.

import pandas as pd

df = pd.DataFrame({'X': [1, 2, None, 3],
                   'Y': [4, 3, 3, 4]})
print("DataFrame:")
print(df)
means=df.mean(skipna=False)
print("Mean of Columns")
print(means)

Resultado:

DataFrame:
     X  Y
0  1.0  4
1  2.0  3
2  NaN  3
3  3.0  4
Mean of Columns
X    NaN
Y    3.5
dtype: float64

Aquí, obtenemos el valor NaN para la media de la columna X, ya que la columna X tiene el valor NaN presente en ella.

Suraj Joshi avatar Suraj Joshi avatar

Suraj Joshi is a backend software engineer at Matrice.ai.

LinkedIn

Artículo relacionado - Pandas DataFrame