Pandas Series Series.value_counts() 함수

Suraj Joshi 2023년1월30일
  1. pandas.Series.value_counts()의 구문 :
  2. 예제 코드: Series.value_counts()메서드를 사용하여 Pandas 시리즈에서 고유 요소의 발생 횟수 계산
  3. 예제 코드: 요소의 상대 주파수를 얻기 위해Series.value_counts()메서드에서normalize = True를 설정합니다
  4. 예제 코드: Series.value_counts()메서드에서ascending = True를 설정하여 빈도 값을 기준으로 오름차순으로 요소를 정렬합니다
  5. 예제 코드: Series.value_counts()메서드에서bins 매개 변수를 설정하여 반 개방 빈에있는 값의 개수를 얻습니다
  6. 예제 코드: Series.value_counts()메서드의dropna = FalseNaN 개수로 설정
Pandas Series Series.value_counts() 함수

pandas.Series.value_counts() 방법은 Series에서 각 고유 요소의 발생 횟수를 계산한다.

pandas.Series.value_counts()의 구문 :

Series.value_counts(normalize=False, sort=True, ascending=False, bins=None, dropna=True)

매개 변수

normalize 부울. 고유 값의 상대 빈도 (normalize = True) 또는 고유 값의 절대 빈도 (normalize = False)입니다.
sort 부울. 빈도 (sort = True)를 기준으로 요소를 정렬하거나 Series 객체를 정렬되지 않은 상태로 둡니다 (sort = False).
ascending 부울. 오름차순 (ascending = True) 또는 내림차순 (ascending = False)으로 값 정렬
bins 정수. Series 객체의 값 범위가 분할 된 파티션 수
dropna 부울. NaN (dropna = False) 개수를 포함하거나NaN (dropna = True) 개수를 제외합니다.

반환

고유 한 값의 개수로 구성된 Series 객체를 반환합니다.

예제 코드: Series.value_counts()메서드를 사용하여 Pandas 시리즈에서 고유 요소의 발생 횟수 계산

import pandas as pd
import numpy as np

df = pd.DataFrame({'X': [1, 2, 3, np.nan, 3],
                   'Y': [4, np.nan, 8, np.nan, 3]})
print("DataFrame:")
print(df)

absolute_counts=df["X"].value_counts()

print("Frequencies of elements of X column:")
print(absolute_counts)

출력:

DataFrame:
     X    Y
0  1.0  4.0
1  2.0  NaN
2  3.0  8.0
3  NaN  NaN
4  3.0  3.0
Frequencies of elements of X column:
3.0    2
2.0    1
1.0    1
Name: X, dtype: int64 

absolute_countsSeries.value_counts()메소드를 사용하여X 열의 각 고유 요소의 개수를 제공합니다.

Series.value_counts()는 기본적으로NaN을 계산하지 않습니다. 다음 섹션에서 계산하는 방법을 소개합니다.

예제 코드: 요소의 상대 주파수를 얻기 위해Series.value_counts()메서드에서normalize = True를 설정합니다

Series.value_counts()메서드에서normalize = True를 설정하면Series 객체에있는 모든 고유 요소의 상대 빈도를 얻습니다.

import pandas as pd
import numpy as np

df = pd.DataFrame({'X': [1, 2, 3, np.nan, 3],
                   'Y': [4, np.nan, 8, np.nan, 3]})
print("DataFrame:")
print(df)

relative_counts=df["X"].value_counts(normalize=True)

print("Relative Frequencies of elements of X column:")
print(relative_counts)

출력:

DataFrame:
     X    Y
0  1.0  4.0
1  2.0  NaN
2  3.0  8.0
3  NaN  NaN
4  3.0  3.0
Frequencies of elements of X column:
3.0    0.50
2.0    0.25
1.0    0.25
Name: X, dtype: float64

relative_counts Series 객체는X 열의 고유 한 각 요소의 상대 빈도를 제공합니다.

상대 주파수는 모든 절대 주파수를 절대 주파수의 합으로 나눈 값입니다.

예제 코드: Series.value_counts()메서드에서ascending = True를 설정하여 빈도 값을 기준으로 오름차순으로 요소를 정렬합니다

Series.value_counts()메서드에서ascending = True를 설정하면 빈도 값을 기준으로 오름차순으로 정렬 된 요소가있는Series 객체를 얻습니다.

기본적으로Series.value_counts()메서드에서 반환 된 Series 객체의 값은 빈도 값을 기준으로 내림차순으로 정렬됩니다.

import pandas as pd
import numpy as np

df = pd.DataFrame({'X': [1, 2, 3, np.nan, 3],
                   'Y': [4, np.nan, 8, np.nan, 3]})
print("DataFrame:")
print(df)

sorted_counts=df["X"].value_counts(ascending=True)
print("Frequencies of elements of X column:")
print(sorted_counts)

출력:

DataFrame:
     X    Y
0  1.0  4.0
1  2.0  NaN
2  3.0  8.0
3  NaN  NaN
4  3.0  3.0
Frequencies of elements of X column:
1.0    1
2.0    1
3.0    2
Name: X, dtype: int64

오름차순으로 정렬 된 빈도 값과 함께X 열에있는 각 고유 개체의 개수를 제공합니다.

예제 코드: Series.value_counts()메서드에서bins 매개 변수를 설정하여 반 개방 빈에있는 값의 개수를 얻습니다

import pandas as pd
import numpy as np

df = pd.DataFrame({'X': [1, 2, 3, np.nan, 3, 4, 5],
                   'Y': [4, np.nan, 8, np.nan, 3, 2, 1]})
print("DataFrame:")
print(df)

counts=df["X"].value_counts(bins=3)
print("Frequencies:")
print(counts)

출력:

DataFrame:
     X    Y
0  1.0  4.0
1  2.0  NaN
2  3.0  8.0
3  NaN  NaN
4  3.0  3.0
5  4.0  2.0
6  5.0  1.0
Frequencies:
(3.667, 5.0]      2
(2.333, 3.667]    2
(0.995, 2.333]    2
Name: X, dtype: int64

Series, 즉 X열의 값 범위를 세 부분으로 나누고 각 반 개방 빈에있는 값의 개수를 반환합니다.

예제 코드: Series.value_counts()메서드의dropna = FalseNaN 개수로 설정

Series.value_counts()메소드에서dropna = False를 설정하면NaN 값의 개수도 얻습니다.

import pandas as pd
import numpy as np

df = pd.DataFrame({'X': [1, 2, 3, np.nan, 3],
                   'Y': [4, np.nan, 8, np.nan, 3]})
print("DataFrame:")
print(df)

counts=df["Y"].value_counts(dropna=False)

print("Frequencies:")
print(counts)

출력:

DataFrame:
     X    Y
0  1.0  4.0
1  2.0  NaN
2  3.0  8.0
3  NaN  NaN
4  3.0  3.0
Frequencies:
NaN    2
3.0    1
8.0    1
4.0    1
Name: Y, dtype: int64

NaN값의 개수와 함께 DataFrameY열에있는 각 요소의 개수를 제공합니다.

작가: Suraj Joshi
Suraj Joshi avatar Suraj Joshi avatar

Suraj Joshi is a backend software engineer at Matrice.ai.

LinkedIn

관련 문장 - Pandas Series