Pandas DataFrame DataFrame.sum() 함수

Suraj Joshi 2023년1월30일 Pandas Pandas DataFrame

pandas.DataFrame.sum()의 구문 :
예제 코드: 열 축을 따라 합계를 계산하는DataFrame.sum()메서드
예제 코드: 행 축을 따라 합계를 찾는DataFrame.sum()메서드
예제 코드: NaN 값을 무시하고 합계를 찾는DataFrame.sum()메서드
예제 코드: DataFrame.sum()메서드에서min_count 설정

Python Pandas DataFrame.sum()의 기능은 다음의 합계를 계산하는 것입니다. 지정된 축에 대한DataFrame 개체의 값.

`pandas.DataFrame.sum()`의 구문 :

DataFrame.sum(
    axis=None, skipna=None, level=None, numeric_only=None, min_count=0, **kwargs
)

매개 변수


`axis`	`행`(`axis=0`) 또는`열`(`axis=1`)을 따라 합계 찾기
`skipna`	부울. `NaN` 값 (`skipna=True`)을 제외하거나`NaN` 값 (`skipna=False`)을 포함합니다.
`level`	축이 `MultiIndex`인 경우 특정 수준과 함께 계산
`numeric_only`	부울. `numeric_only=True`의 경우`float`,`int` 및`boolean` 열만 포함합니다.
`min_count`	정수. 합계를 계산하기위한 비 `NaN`값의 최소 개수입니다. 이 조건이 충족되지 않으면 합계는`NaN`이됩니다.
`**kwargs`	함수에 대한 추가 키워드 인수입니다.

반환

level이 지정되지 않은 경우 요청 된 축에 대한 값의 합계의Series를 반환하고, 그렇지 않으면 합계 값의DataFrame을 반환합니다.

예제 코드: 열 축을 따라 합계를 계산하는`DataFrame.sum()`메서드

import pandas as pd

df = pd.DataFrame({'X': 
                   [1,2,3,4,5], 
                   'Y': [1, 2, 3,4,5], 
                   'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)

sums=df.sum()
print("Column-wise Sum:")
print(sums)

출력:

DataFrame:
   X  Y  Z
0  1  1  3
1  2  2  4
2  3  3  5
3  4  4  6
4  5  5  3
Column-wise Sum:
X    15
Y    15
Z    21
dtype: int64

모든X,Y,Z 열의 합계를 계산하고 마지막으로 각 열의 합계가있는Series 객체를 반환합니다.

Pandas에서DataFrame의 특정 열 합계를 찾으려면 해당 열에 대해서만sum()함수를 호출해야합니다.

import pandas as pd

df = pd.DataFrame({'X': 
                   [1,2,3,4,5], 
                   'Y': [1, 2, 3,4,5], 
                   'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)

sums=df["Z"].sum()
print("Sum of values of Z-column:")
print(sums)

출력:

DataFrame:
   X  Y  Z
0  1  1  3
1  2  2  4
2  3  3  5
3  4  4  6
4  5  5  3
Sum of values of Z-column:
21

DataFrame의 Z열 값의 합계 만 제공합니다.

예제 코드: 행 축을 따라 합계를 찾는`DataFrame.sum()`메서드

import pandas as pd

df = pd.DataFrame({'X': 
                   [1,2,3,4,5], 
                   'Y': [1, 2, 3,4,5], 
                   'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)

sums=df.sum(axis=1)
print("Row-wise sum:")
print(sums)

출력:

DataFrame:
   X  Y  Z
0  1  1  3
1  2  2  4
2  3  3  5
3  4  4  6
4  5  5  3
Row-wise sum:
0     5
1     8
2    11
3    14
4    13
dtype: int64

모든 행의 합계를 계산하고 마지막으로 각 행의 합계와 함께Series 객체를 반환합니다.

Pandas에서DataFrame의 특정 행의 합계를 찾으려면 해당 특정 행에 대해서만sum()함수를 호출해야합니다.


import pandas as pd

df = pd.DataFrame({'X': 
                   [1,2,3,4,5], 
                   'Y': [1, 2, 3,4,5], 
                   'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)

sum_3=df.iloc[[2]].sum(axis=1)
print("Sum of values of 3rd Row:")
print(sum_3)

출력:

DataFrame:
   X  Y  Z
0  1  1  3
1  2  2  4
2  3  3  5
3  4  4  6
4  5  5  3
Sum of values of 3rd Row:
2    11
dtype: int64

DataFrame의 세 번째 행 값의 합계 만 제공합니다.

색인을 기반으로 행을 선택하려면iloc 메소드를 사용하십시오.

예제 코드: `NaN` 값을 무시하고 합계를 찾는`DataFrame.sum()`메서드

skipna매개 변수의 기본값 (예: skipna = True)을 사용하여 NaN값을 무시하고 지정된 축을 따라 DataFrame의 합계를 찾습니다.

import pandas as pd
df = pd.DataFrame({'X': 
                   [1,None,3,4,5], 
                   'Y': [1, None, 3,None,5], 
                   'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)

sums=df.sum()
print("Column-wise Sum:")
print(sums)

출력:

DataFrame:
     X    Y  Z
0  1.0  1.0  3
1  NaN  NaN  4
2  3.0  3.0  5
3  4.0  NaN  6
4  5.0  5.0  3
Column-wise Sum:
X    13.0
Y     9.0
Z    21.0
dtype: float64

skipna=True를 설정하면 DataFrame에NaN 값이 있으면 합계의NaN 값을 얻게됩니다.


import pandas as pd

df = pd.DataFrame({'X': 
                   [1,None,3,4,5], 
                   'Y': [1, None, 3,None,5], 
                   'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)

sums=df.sum(skipna=False)
print("Column-wise Sum:")
print(sums)

출력:

DataFrame:
     X    Y  Z
0  1.0  1.0  3
1  NaN  NaN  4
2  3.0  3.0  5
3  4.0  NaN  6
4  5.0  5.0  3
Column-wise Sum:
X     NaN
Y     NaN
Z    21.0
dtype: float64

여기에서 열X와Y 모두에NaN 값이 있으므로NaN 값을 얻습니다.

예제 코드: `DataFrame.sum()`메서드에서`min_count` 설정

import pandas as pd

df = pd.DataFrame({'X': 
                   [1,None,3,4,5], 
                   'Y': [1, None, 3,None,5], 
                   'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)

sums=df.sum(min_count=4)
print("Column-wise Sum:")
print(sums)

출력:

DataFrame:
     X    Y  Z
0  1.0  1.0  3
1  NaN  NaN  4
2  3.0  3.0  5
3  4.0  NaN  6
4  5.0  5.0  3
Column-wise Sum:
X    13.0
Y     NaN
Z    21.0
dtype: float64

여기서 Y열의 합계에 대한 NaN값을 얻습니다. 열 Y에는 min_count매개 변수의 값보다 작은 3비 NaN값만 있습니다.

튜토리얼이 마음에 드시나요? DelftStack을 구독하세요 YouTube에서 저희가 더 많은 고품질 비디오 가이드를 제작할 수 있도록 지원해주세요. 구독하다

작가: Suraj Joshi

Suraj Joshi is a backend software engineer at Matrice.ai.

pandas.DataFrame.sum()의 구문 :

매개 변수

반환

예제 코드: 열 축을 따라 합계를 계산하는DataFrame.sum()메서드

예제 코드: 행 축을 따라 합계를 찾는DataFrame.sum()메서드

예제 코드: NaN 값을 무시하고 합계를 찾는DataFrame.sum()메서드

예제 코드: DataFrame.sum()메서드에서min_count 설정

관련 문장 - Pandas DataFrame

`pandas.DataFrame.sum()`의 구문 :

예제 코드: 열 축을 따라 합계를 계산하는`DataFrame.sum()`메서드

예제 코드: 행 축을 따라 합계를 찾는`DataFrame.sum()`메서드

예제 코드: `NaN` 값을 무시하고 합계를 찾는`DataFrame.sum()`메서드

예제 코드: `DataFrame.sum()`메서드에서`min_count` 설정