Pandas Series Series.value_counts() 함수

Suraj Joshi 2023년1월30일 Pandas Pandas Series

pandas.Series.value_counts()의 구문 :
예제 코드: Series.value_counts()메서드를 사용하여 Pandas 시리즈에서 고유 요소의 발생 횟수 계산
예제 코드: 요소의 상대 주파수를 얻기 위해Series.value_counts()메서드에서normalize = True를 설정합니다
예제 코드: Series.value_counts()메서드에서ascending = True를 설정하여 빈도 값을 기준으로 오름차순으로 요소를 정렬합니다
예제 코드: Series.value_counts()메서드에서bins 매개 변수를 설정하여 반 개방 빈에있는 값의 개수를 얻습니다
예제 코드: Series.value_counts()메서드의dropna = False를NaN 개수로 설정

pandas.Series.value_counts() 방법은 Series에서 각 고유 요소의 발생 횟수를 계산한다.

`pandas.Series.value_counts()`의 구문 :

Series.value_counts(normalize=False, sort=True, ascending=False, bins=None, dropna=True)

매개 변수


`normalize`	부울. 고유 값의 상대 빈도 (`normalize = True`) 또는 고유 값의 절대 빈도 (`normalize = False`)입니다.
`sort`	부울. 빈도 (`sort = True`)를 기준으로 요소를 정렬하거나 Series 객체를 정렬되지 않은 상태로 둡니다 (`sort = False`).
`ascending`	부울. 오름차순 (`ascending = True`) 또는 내림차순 (`ascending = False`)으로 값 정렬
`bins`	정수. `Series` 객체의 값 범위가 분할 된 파티션 수
`dropna`	부울. `NaN` (`dropna = False`) 개수를 포함하거나`NaN` (`dropna = True`) 개수를 제외합니다.

반환

고유 한 값의 개수로 구성된 Series 객체를 반환합니다.

예제 코드: `Series.value_counts()`메서드를 사용하여 Pandas 시리즈에서 고유 요소의 발생 횟수 계산

import pandas as pd
import numpy as np

df = pd.DataFrame({'X': [1, 2, 3, np.nan, 3],
                   'Y': [4, np.nan, 8, np.nan, 3]})
print("DataFrame:")
print(df)

absolute_counts=df["X"].value_counts()

print("Frequencies of elements of X column:")
print(absolute_counts)

출력:

DataFrame:
     X    Y
0  1.0  4.0
1  2.0  NaN
2  3.0  8.0
3  NaN  NaN
4  3.0  3.0
Frequencies of elements of X column:
3.0    2
2.0    1
1.0    1
Name: X, dtype: int64

absolute_counts는Series.value_counts()메소드를 사용하여X 열의 각 고유 요소의 개수를 제공합니다.

Series.value_counts()는 기본적으로NaN을 계산하지 않습니다. 다음 섹션에서 계산하는 방법을 소개합니다.

예제 코드: 요소의 상대 주파수를 얻기 위해`Series.value_counts()`메서드에서`normalize = True`를 설정합니다

Series.value_counts()메서드에서normalize = True를 설정하면Series 객체에있는 모든 고유 요소의 상대 빈도를 얻습니다.

import pandas as pd
import numpy as np

df = pd.DataFrame({'X': [1, 2, 3, np.nan, 3],
                   'Y': [4, np.nan, 8, np.nan, 3]})
print("DataFrame:")
print(df)

relative_counts=df["X"].value_counts(normalize=True)

print("Relative Frequencies of elements of X column:")
print(relative_counts)

출력:

DataFrame:
     X    Y
0  1.0  4.0
1  2.0  NaN
2  3.0  8.0
3  NaN  NaN
4  3.0  3.0
Frequencies of elements of X column:
3.0    0.50
2.0    0.25
1.0    0.25
Name: X, dtype: float64

relative_counts Series 객체는X 열의 고유 한 각 요소의 상대 빈도를 제공합니다.

상대 주파수는 모든 절대 주파수를 절대 주파수의 합으로 나눈 값입니다.

예제 코드: `Series.value_counts()`메서드에서`ascending = True`를 설정하여 빈도 값을 기준으로 오름차순으로 요소를 정렬합니다

Series.value_counts()메서드에서ascending = True를 설정하면 빈도 값을 기준으로 오름차순으로 정렬 된 요소가있는Series 객체를 얻습니다.

기본적으로Series.value_counts()메서드에서 반환 된 Series 객체의 값은 빈도 값을 기준으로 내림차순으로 정렬됩니다.

import pandas as pd
import numpy as np

df = pd.DataFrame({'X': [1, 2, 3, np.nan, 3],
                   'Y': [4, np.nan, 8, np.nan, 3]})
print("DataFrame:")
print(df)

sorted_counts=df["X"].value_counts(ascending=True)
print("Frequencies of elements of X column:")
print(sorted_counts)

출력:

DataFrame:
     X    Y
0  1.0  4.0
1  2.0  NaN
2  3.0  8.0
3  NaN  NaN
4  3.0  3.0
Frequencies of elements of X column:
1.0    1
2.0    1
3.0    2
Name: X, dtype: int64

오름차순으로 정렬 된 빈도 값과 함께X 열에있는 각 고유 개체의 개수를 제공합니다.

예제 코드: `Series.value_counts()`메서드에서`bins` 매개 변수를 설정하여 반 개방 빈에있는 값의 개수를 얻습니다

import pandas as pd
import numpy as np

df = pd.DataFrame({'X': [1, 2, 3, np.nan, 3, 4, 5],
                   'Y': [4, np.nan, 8, np.nan, 3, 2, 1]})
print("DataFrame:")
print(df)

counts=df["X"].value_counts(bins=3)
print("Frequencies:")
print(counts)

출력:

DataFrame:
     X    Y
0  1.0  4.0
1  2.0  NaN
2  3.0  8.0
3  NaN  NaN
4  3.0  3.0
5  4.0  2.0
6  5.0  1.0
Frequencies:
(3.667, 5.0]      2
(2.333, 3.667]    2
(0.995, 2.333]    2
Name: X, dtype: int64

Series, 즉 X열의 값 범위를 세 부분으로 나누고 각 반 개방 빈에있는 값의 개수를 반환합니다.

예제 코드: `Series.value_counts()`메서드의`dropna = False`를`NaN` 개수로 설정

Series.value_counts()메소드에서dropna = False를 설정하면NaN 값의 개수도 얻습니다.

import pandas as pd
import numpy as np

df = pd.DataFrame({'X': [1, 2, 3, np.nan, 3],
                   'Y': [4, np.nan, 8, np.nan, 3]})
print("DataFrame:")
print(df)

counts=df["Y"].value_counts(dropna=False)

print("Frequencies:")
print(counts)

출력:

DataFrame:
     X    Y
0  1.0  4.0
1  2.0  NaN
2  3.0  8.0
3  NaN  NaN
4  3.0  3.0
Frequencies:
NaN    2
3.0    1
8.0    1
4.0    1
Name: Y, dtype: int64

NaN값의 개수와 함께 DataFrame의Y열에있는 각 요소의 개수를 제공합니다.

튜토리얼이 마음에 드시나요? DelftStack을 구독하세요 YouTube에서 저희가 더 많은 고품질 비디오 가이드를 제작할 수 있도록 지원해주세요. 구독하다

작가: Suraj Joshi

Suraj Joshi is a backend software engineer at Matrice.ai.

pandas.Series.value_counts()의 구문 :

매개 변수

반환

예제 코드: Series.value_counts()메서드를 사용하여 Pandas 시리즈에서 고유 요소의 발생 횟수 계산

예제 코드: 요소의 상대 주파수를 얻기 위해Series.value_counts()메서드에서normalize = True를 설정합니다

예제 코드: Series.value_counts()메서드에서ascending = True를 설정하여 빈도 값을 기준으로 오름차순으로 요소를 정렬합니다

예제 코드: Series.value_counts()메서드에서bins 매개 변수를 설정하여 반 개방 빈에있는 값의 개수를 얻습니다

예제 코드: Series.value_counts()메서드의dropna = False를NaN 개수로 설정

관련 문장 - Pandas Series