Funzione Pandas DataFrame DataFrame.sum()
- 
          
            Sintassi di 
pandas.DataFrame.sum(): - 
          
            Codici di esempio: Metodo 
DataFrame.sum()per calcolare la somma lungo l’asse delle colonne - 
          
            Codici di esempio: Metodo 
DataFrame.sum()per trovare la somma lungo l’asse di riga - 
          
            Codici di esempio: Metodo 
DataFrame.sum()per trovare la somma ignorando i valoriNaN - 
          
            Codici di esempio: imposta 
min_countnel metodoDataFrame.sum() 
La funzione del Python Pandas DataFrame.sum() è calcolare la somma dei valori dell’oggetto DataFrame sull’asse specificato.
Sintassi di pandas.DataFrame.sum():
DataFrame.sum(
    axis=None, skipna=None, level=None, numeric_only=None, min_count=0, **kwargs
)
Parametri
axis | 
trova la somma lungo la riga (axis = 0) o la colonna (axis = 1) | 
skipna | 
Booleano. Escludi i valori NaN (skipna=True) o includi i valori NaN (skipna=False) | 
level | 
Conta insieme a un livello particolare se l’asse è MultiIndex | 
numeric_only | 
Booleano. Per numeric_only=True, includi solo le colonne float, int e boolean | 
min_count | 
Numero intero. Numero minimo di valori non-NaN per calcolare la somma. Se questa condizione non è soddisfatta, la somma sarà NaN | 
**kwargs | 
Argomenti di parole chiave aggiuntivi per la funzione. | 
Ritorno
Se il livello non è specificato, restituisce Series della somma dei valori per l’asse richiesto, altrimenti restituisce DataFrame dei valori della somma.
Codici di esempio: Metodo DataFrame.sum() per calcolare la somma lungo l’asse delle colonne
import pandas as pd
df = pd.DataFrame({'X': 
                   [1,2,3,4,5], 
                   'Y': [1, 2, 3,4,5], 
                   'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)
sums=df.sum()
print("Column-wise Sum:")
print(sums)
Produzione:
DataFrame:
   X  Y  Z
0  1  1  3
1  2  2  4
2  3  3  5
3  4  4  6
4  5  5  3
Column-wise Sum:
X    15
Y    15
Z    21
dtype: int64
Calcola la somma di tutte le colonne X, Y e Z e infine restituisce un oggetto Series con la somma di ciascuna colonna.
Per trovare la somma di una particolare colonna di DataFrame in Pandas, devi chiamare la funzione sum() solo per quella colonna.
import pandas as pd
df = pd.DataFrame({'X': 
                   [1,2,3,4,5], 
                   'Y': [1, 2, 3,4,5], 
                   'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)
sums=df["Z"].sum()
print("Sum of values of Z-column:")
print(sums)
Produzione:
DataFrame:
   X  Y  Z
0  1  1  3
1  2  2  4
2  3  3  5
3  4  4  6
4  5  5  3
Sum of values of Z-column:
21
Fornisce solo la somma dei valori della colonna Z di DataFrame.
Codici di esempio: Metodo DataFrame.sum() per trovare la somma lungo l’asse di riga
import pandas as pd
df = pd.DataFrame({'X': 
                   [1,2,3,4,5], 
                   'Y': [1, 2, 3,4,5], 
                   'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)
sums=df.sum(axis=1)
print("Row-wise sum:")
print(sums)
Produzione:
DataFrame:
   X  Y  Z
0  1  1  3
1  2  2  4
2  3  3  5
3  4  4  6
4  5  5  3
Row-wise sum:
0     5
1     8
2    11
3    14
4    13
dtype: int64
Calcola la somma di tutte le righe e infine restituisce un oggetto Series con la somma di ogni riga.
Per trovare la somma di una particolare riga di DataFrame in Pandas, è necessario chiamare la funzione sum() solo per quella specifica riga.
import pandas as pd
df = pd.DataFrame({'X': 
                   [1,2,3,4,5], 
                   'Y': [1, 2, 3,4,5], 
                   'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)
sum_3=df.iloc[[2]].sum(axis=1)
print("Sum of values of 3rd Row:")
print(sum_3)
Produzione:
DataFrame:
   X  Y  Z
0  1  1  3
1  2  2  4
2  3  3  5
3  4  4  6
4  5  5  3
Sum of values of 3rd Row:
2    11
dtype: int64
Fornisce solo la somma dei valori della 3a riga di DataFrame.
Usa il metodo iloc per selezionare le righe in base all’indice.
Codici di esempio: Metodo DataFrame.sum() per trovare la somma ignorando i valori NaN
Usa il valore predefinito del parametro skipna cioè skipna=True per trovare la somma di DataFrame lungo l’asse specificato, ignorando i valori NaN.
import pandas as pd
df = pd.DataFrame({'X': 
                   [1,None,3,4,5], 
                   'Y': [1, None, 3,None,5], 
                   'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)
sums=df.sum()
print("Column-wise Sum:")
print(sums)
Produzione:
DataFrame:
     X    Y  Z
0  1.0  1.0  3
1  NaN  NaN  4
2  3.0  3.0  5
3  4.0  NaN  6
4  5.0  5.0  3
Column-wise Sum:
X    13.0
Y     9.0
Z    21.0
dtype: float64
Se imposti skipna=True, otterrai valori NaN di somme se il DataFrame ha valori NaN.
import pandas as pd
df = pd.DataFrame({'X': 
                   [1,None,3,4,5], 
                   'Y': [1, None, 3,None,5], 
                   'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)
sums=df.sum(skipna=False)
print("Column-wise Sum:")
print(sums)
Produzione:
DataFrame:
     X    Y  Z
0  1.0  1.0  3
1  NaN  NaN  4
2  3.0  3.0  5
3  4.0  NaN  6
4  5.0  5.0  3
Column-wise Sum:
X     NaN
Y     NaN
Z    21.0
dtype: float64
Qui, ottieni il valore NaN per la somma delle colonne X e Y poiché entrambe hanno i valori NaN.
Codici di esempio: imposta min_count nel metodo DataFrame.sum()
import pandas as pd
df = pd.DataFrame({'X': 
                   [1,None,3,4,5], 
                   'Y': [1, None, 3,None,5], 
                   'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)
sums=df.sum(min_count=4)
print("Column-wise Sum:")
print(sums)
Produzione:
DataFrame:
     X    Y  Z
0  1.0  1.0  3
1  NaN  NaN  4
2  3.0  3.0  5
3  4.0  NaN  6
4  5.0  5.0  3
Column-wise Sum:
X    13.0
Y     NaN
Z    21.0
dtype: float64
Qui, ottieni il valore NaN per la somma della colonna Y poiché la colonna Y ha solo valori 3 non NaN, che è inferiore al valore del parametro min_count.
Suraj Joshi is a backend software engineer at Matrice.ai.
LinkedIn