Pandas DataFrame DataFrame.mean() Fonction

Suraj Joshi 30 janvier 2023
  1. Syntaxe de pandas.DataFrame.mean():
  2. Exemples de codes: méthode DataFrame.mean() pour trouver la moyenne le long de l’axe des colonnes
  3. Exemples de codes: méthode DataFrame.mean() pour trouver la moyenne le long de l’axe Row
  4. Exemples de codes: méthode DataFrame.mean() pour trouver une moyenne ignorant les valeurs NaN
Pandas DataFrame DataFrame.mean() Fonction

Python Pandas DataFrame.mean(), la fonction calcule la moyenne des valeurs de l’objet DataFrame sur la axe spécifié.

Syntaxe de pandas.DataFrame.mean():

DataFrame.mean(axis=None, skipna=None, level=None, numeric_only=None, **kwargs)

Paramètres

axis trouver la moyenne le long de la ligne (axis = 0) ou de la colonne (axis = 1)
skipna Booléen. Exclure les valeurs NaN (skipna = True) ou inclure les valeurs NaN (skipna = False)
level Comptez avec un niveau particulier si l’axe est MultiIndex
numeric_only Booléen. Pour numeric_only = True, incluez uniquement les colonnes float, int et boolean
**kwargs Arguments de mots clés supplémentaires à la fonction.

Revenir

Si le level n’est pas spécifié, retournez Series de la moyenne des valeurs pour l’axe demandé, sinon retournez DataFrame des valeurs moyennes.

Exemples de codes: méthode DataFrame.mean() pour trouver la moyenne le long de l’axe des colonnes

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 2, 3],
                   'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)

means=df.mean()
print("Means of Each Column:")
print(means)

Production:

DataFrame:
   X  Y
0  1  4
1  2  3
2  2  8
3  3  4
Means of Each Column:
X    2.00
Y    4.75
dtype: float64

Il calcule la moyenne pour les deux colonnes X et Y et retourne finalement un objet Series avec la moyenne de chaque colonne.

Pour trouver la moyenne d’une colonne particulière de DataFrame dans Pandas, nous appelons la fonction mean() pour cette colonne uniquement.

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 2, 3],
                   'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)

means=df["X"].mean()
print("Mean of Column X:")
print(means)

Production:

DataFrame:
   X  Y
0  1  4
1  2  3
2  2  8
3  3  4
Mean of Column X:
2.0

Il ne donne que la moyenne des valeurs de la colonne X de DataFrame.

Exemples de codes: méthode DataFrame.mean() pour trouver la moyenne le long de l’axe Row

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 2, 3],
                   'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)

means=df.mean(axis=1)
print("Mean of Rows:")
print(means)

Production:

DataFrame:
   X  Y
0  1  4
1  2  3
2  2  8
3  3  4
Mean of Rows:
0    2.5
1    2.5
2    5.0
3    3.5
dtype: float64

Il calcule la moyenne de toutes les lignes et retourne finalement un objet Series avec la moyenne de chaque ligne.

Pour trouver la moyenne d’une ligne particulière de DataFrame dans Pandas, nous appelons la fonction mean() pour cette ligne uniquement.

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 2, 3],
                   'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)

mean=df.iloc[[0]].mean(axis=1)
print("Mean of 1st Row:")
print(mean)

Production:

DataFrame:
   X  Y
0  1  4
1  2  3
2  2  8
3  3  4
Mean of 1st Row:
0    2.5
dtype: float64

Il ne donne que la moyenne des valeurs de la 1ère ligne de DataFrame.

Nous utilisons la méthode iloc pour sélectionner les lignes en fonction de l’index.

Exemples de codes: méthode DataFrame.mean() pour trouver une moyenne ignorant les valeurs NaN

Nous utilisons la valeur par défaut du paramètre skipna c’est-à-dire skipna = True pour trouver la moyenne de DataFrame le long de l’axe spécifié en ignorant les valeurs de NaN.

import pandas as pd

df = pd.DataFrame({'X': [1, 2, None, 3],
                   'Y': [4, 3, None, 4]})
print("DataFrame:")
print(df)

means=df.mean(skipna=True)
print("Mean of Columns")
print(means)

Production:

DataFrame:
     X    Y
0  1.0  4.0
1  2.0  3.0
2  NaN  NaN
3  3.0  4.0
Mean of Columns
X    2.000000
Y    3.666667
dtype: float64

Si nous définissons skipna = True, il ignore le NaN dans la trame de données. Il nous permet de calculer la moyenne de DataFrame le long de l’axe de la colonne en ignorant les valeurs de NaN.

import pandas as pd

df = pd.DataFrame({'X': [1, 2, None, 3],
                   'Y': [4, 3, 3, 4]})
print("DataFrame:")
print(df)
means=df.mean(skipna=False)
print("Mean of Columns")
print(means)

Production:

DataFrame:
     X  Y
0  1.0  4
1  2.0  3
2  NaN  3
3  3.0  4
Mean of Columns
X    NaN
Y    3.5
dtype: float64

Ici, nous obtenons une valeur de NaN pour la moyenne de la colonne X car la colonne X contient une valeur de NaN.

Auteur: Suraj Joshi
Suraj Joshi avatar Suraj Joshi avatar

Suraj Joshi is a backend software engineer at Matrice.ai.

LinkedIn

Article connexe - Pandas DataFrame