Funzione Pandas DataFrame DataFrame.mean()

Suraj Joshi 30 gennaio 2023
  1. Sintassi di pandas.DataFrame.mean():
  2. Codici di esempio: Metodo DataFrame.mean() per trovare la media lungo l’asse di colonna
  3. Codici di esempio: Metodo DataFrame.mean() per trovare la media lungo l’asse delle righe
  4. Codici di esempio: Metodo DataFrame.mean() per trovare la media ignorando i valori NaN
Funzione Pandas DataFrame DataFrame.mean()

La funzione Python Pandas DataFrame.mean() calcola la media dei valori dell’oggetto DataFrame sull’asse specificato.

Sintassi di pandas.DataFrame.mean():

DataFrame.mean(axis=None, skipna=None, level=None, numeric_only=None, **kwargs)

Parametri

axis trova la media lungo la riga (axis = 0) o la colonna (axis = 1)
skipna Booleano. Escludi i valori NaN (skipna=True) o includi i valori NaN (skipna=False)
level Conta insieme a un livello particolare se l’asse è MultiIndex
numeric_only Booleano. Per numeric_only=True, includi solo le colonne float, int e boolean
**kwargs Argomenti di parole chiave aggiuntivi per la funzione.

Ritorno

Se il livello non è specificato, restituisce Series della media dei valori per l’asse richiesto, altrimenti restituisce DataFrame dei valori medi.

Codici di esempio: Metodo DataFrame.mean() per trovare la media lungo l’asse di colonna

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 2, 3],
                   'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)

means=df.mean()
print("Means of Each Column:")
print(means)

Produzione:

DataFrame:
   X  Y
0  1  4
1  2  3
2  2  8
3  3  4
Means of Each Column:
X    2.00
Y    4.75
dtype: float64

Calcola la media per entrambe le colonne X e Y e infine restituisce un oggetto Series con la media di ciascuna colonna.

Per trovare la media di una particolare colonna di DataFrame in Pandas, chiamiamo la funzione mean() solo per quella colonna.

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 2, 3],
                   'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)

means=df["X"].mean()
print("Mean of Column X:")
print(means)

Produzione:

DataFrame:
   X  Y
0  1  4
1  2  3
2  2  8
3  3  4
Mean of Column X:
2.0

Fornisce solo la media dei valori della colonna X di DataFrame.

Codici di esempio: Metodo DataFrame.mean() per trovare la media lungo l’asse delle righe

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 2, 3],
                   'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)

means=df.mean(axis=1)
print("Mean of Rows:")
print(means)

Produzione:

DataFrame:
   X  Y
0  1  4
1  2  3
2  2  8
3  3  4
Mean of Rows:
0    2.5
1    2.5
2    5.0
3    3.5
dtype: float64

Calcola la media per tutte le righe e infine restituisce un oggetto Series con la media di ogni riga.

Per trovare la media di una particolare riga di DataFrame in Pandas, chiamiamo la funzione mean() solo per quella riga.

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 2, 3],
                   'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)

mean=df.iloc[[0]].mean(axis=1)
print("Mean of 1st Row:")
print(mean)

Produzione:

DataFrame:
   X  Y
0  1  4
1  2  3
2  2  8
3  3  4
Mean of 1st Row:
0    2.5
dtype: float64

Fornisce solo la media dei valori della prima riga di DataFrame.

Usiamo il metodo iloc per selezionare le righe in base all’indice.

Codici di esempio: Metodo DataFrame.mean() per trovare la media ignorando i valori NaN

Usiamo il valore predefinito del parametro skipna cioè skipna=True per trovare la media di DataFrame lungo l’asse specificato ignorando i valori NaN.

import pandas as pd

df = pd.DataFrame({'X': [1, 2, None, 3],
                   'Y': [4, 3, None, 4]})
print("DataFrame:")
print(df)

means=df.mean(skipna=True)
print("Mean of Columns")
print(means)

Produzione:

DataFrame:
     X    Y
0  1.0  4.0
1  2.0  3.0
2  NaN  NaN
3  3.0  4.0
Mean of Columns
X    2.000000
Y    3.666667
dtype: float64

Se impostiamo skipna=True, ignora il NaN nel dataframe. Ci permette di calcolare la media di DataFrame lungo l’asse della colonna ignorando i valori di NaN.

import pandas as pd

df = pd.DataFrame({'X': [1, 2, None, 3],
                   'Y': [4, 3, 3, 4]})
print("DataFrame:")
print(df)
means=df.mean(skipna=False)
print("Mean of Columns")
print(means)

Produzione:

DataFrame:
     X  Y
0  1.0  4
1  2.0  3
2  NaN  3
3  3.0  4
Mean of Columns
X    NaN
Y    3.5
dtype: float64

Qui, otteniamo il valore NaN per la media della colonna X poiché la colonna X ha il valore NaN presente in essa.

Autore: Suraj Joshi
Suraj Joshi avatar Suraj Joshi avatar

Suraj Joshi is a backend software engineer at Matrice.ai.

LinkedIn

Articolo correlato - Pandas DataFrame