Pandas DataFrame DataFrame.sum() 함수

Suraj Joshi 2023년1월30일
  1. pandas.DataFrame.sum()의 구문 :
  2. 예제 코드: 열 축을 따라 합계를 계산하는DataFrame.sum()메서드
  3. 예제 코드: 행 축을 따라 합계를 찾는DataFrame.sum()메서드
  4. 예제 코드: NaN 값을 무시하고 합계를 찾는DataFrame.sum()메서드
  5. 예제 코드: DataFrame.sum()메서드에서min_count 설정
Pandas DataFrame DataFrame.sum() 함수

Python Pandas DataFrame.sum()의 기능은 다음의 합계를 계산하는 것입니다. 지정된 축에 대한DataFrame 개체의 값.

pandas.DataFrame.sum()의 구문 :

DataFrame.sum(
    axis=None, skipna=None, level=None, numeric_only=None, min_count=0, **kwargs
)

매개 변수

axis (axis=0) 또는(axis=1)을 따라 합계 찾기
skipna 부울. NaN 값 (skipna=True)을 제외하거나NaN 값 (skipna=False)을 포함합니다.
level 축이 MultiIndex인 경우 특정 수준과 함께 계산
numeric_only 부울. numeric_only=True의 경우float,intboolean 열만 포함합니다.
min_count 정수. 합계를 계산하기위한 비 NaN값의 최소 개수입니다. 이 조건이 충족되지 않으면 합계는NaN이됩니다.
**kwargs 함수에 대한 추가 키워드 인수입니다.

반환

level이 지정되지 않은 경우 요청 된 축에 대한 값의 합계의Series를 반환하고, 그렇지 않으면 합계 값의DataFrame을 반환합니다.

예제 코드: 열 축을 따라 합계를 계산하는DataFrame.sum()메서드

import pandas as pd

df = pd.DataFrame({'X': 
                   [1,2,3,4,5], 
                   'Y': [1, 2, 3,4,5], 
                   'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)

sums=df.sum()
print("Column-wise Sum:")
print(sums)

출력:

DataFrame:
   X  Y  Z
0  1  1  3
1  2  2  4
2  3  3  5
3  4  4  6
4  5  5  3
Column-wise Sum:
X    15
Y    15
Z    21
dtype: int64

모든X,Y,Z 열의 합계를 계산하고 마지막으로 각 열의 합계가있는Series 객체를 반환합니다.

Pandas에서DataFrame의 특정 열 합계를 찾으려면 해당 열에 대해서만sum()함수를 호출해야합니다.

import pandas as pd

df = pd.DataFrame({'X': 
                   [1,2,3,4,5], 
                   'Y': [1, 2, 3,4,5], 
                   'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)

sums=df["Z"].sum()
print("Sum of values of Z-column:")
print(sums)

출력:

DataFrame:
   X  Y  Z
0  1  1  3
1  2  2  4
2  3  3  5
3  4  4  6
4  5  5  3
Sum of values of Z-column:
21

DataFrameZ열 값의 합계 만 제공합니다.

예제 코드: 행 축을 따라 합계를 찾는DataFrame.sum()메서드

import pandas as pd

df = pd.DataFrame({'X': 
                   [1,2,3,4,5], 
                   'Y': [1, 2, 3,4,5], 
                   'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)

sums=df.sum(axis=1)
print("Row-wise sum:")
print(sums)

출력:

DataFrame:
   X  Y  Z
0  1  1  3
1  2  2  4
2  3  3  5
3  4  4  6
4  5  5  3
Row-wise sum:
0     5
1     8
2    11
3    14
4    13
dtype: int64

모든 행의 합계를 계산하고 마지막으로 각 행의 합계와 함께Series 객체를 반환합니다.

Pandas에서DataFrame의 특정 행의 합계를 찾으려면 해당 특정 행에 대해서만sum()함수를 호출해야합니다.


import pandas as pd

df = pd.DataFrame({'X': 
                   [1,2,3,4,5], 
                   'Y': [1, 2, 3,4,5], 
                   'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)

sum_3=df.iloc[[2]].sum(axis=1)
print("Sum of values of 3rd Row:")
print(sum_3)

출력:

DataFrame:
   X  Y  Z
0  1  1  3
1  2  2  4
2  3  3  5
3  4  4  6
4  5  5  3
Sum of values of 3rd Row:
2    11
dtype: int64

DataFrame의 세 번째 행 값의 합계 만 제공합니다.

색인을 기반으로 행을 선택하려면iloc 메소드를 사용하십시오.

예제 코드: NaN 값을 무시하고 합계를 찾는DataFrame.sum()메서드

skipna매개 변수의 기본값 (예: skipna = True)을 사용하여 NaN값을 무시하고 지정된 축을 따라 DataFrame의 합계를 찾습니다.

import pandas as pd
df = pd.DataFrame({'X': 
                   [1,None,3,4,5], 
                   'Y': [1, None, 3,None,5], 
                   'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)

sums=df.sum()
print("Column-wise Sum:")
print(sums)

출력:

DataFrame:
     X    Y  Z
0  1.0  1.0  3
1  NaN  NaN  4
2  3.0  3.0  5
3  4.0  NaN  6
4  5.0  5.0  3
Column-wise Sum:
X    13.0
Y     9.0
Z    21.0
dtype: float64

skipna=True를 설정하면 DataFrame에NaN 값이 있으면 합계의NaN 값을 얻게됩니다.


import pandas as pd

df = pd.DataFrame({'X': 
                   [1,None,3,4,5], 
                   'Y': [1, None, 3,None,5], 
                   'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)

sums=df.sum(skipna=False)
print("Column-wise Sum:")
print(sums)

출력:

DataFrame:
     X    Y  Z
0  1.0  1.0  3
1  NaN  NaN  4
2  3.0  3.0  5
3  4.0  NaN  6
4  5.0  5.0  3
Column-wise Sum:
X     NaN
Y     NaN
Z    21.0
dtype: float64

여기에서 열XY 모두에NaN 값이 있으므로NaN 값을 얻습니다.

예제 코드: DataFrame.sum()메서드에서min_count 설정

import pandas as pd

df = pd.DataFrame({'X': 
                   [1,None,3,4,5], 
                   'Y': [1, None, 3,None,5], 
                   'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)

sums=df.sum(min_count=4)
print("Column-wise Sum:")
print(sums)

출력:

DataFrame:
     X    Y  Z
0  1.0  1.0  3
1  NaN  NaN  4
2  3.0  3.0  5
3  4.0  NaN  6
4  5.0  5.0  3
Column-wise Sum:
X    13.0
Y     NaN
Z    21.0
dtype: float64

여기서 Y열의 합계에 대한 NaN값을 얻습니다. 열 Y에는 min_count매개 변수의 값보다 작은 3NaN값만 있습니다.

작가: Suraj Joshi
Suraj Joshi avatar Suraj Joshi avatar

Suraj Joshi is a backend software engineer at Matrice.ai.

LinkedIn

관련 문장 - Pandas DataFrame