Pandas Series Series.value_counts() Fonction
-
Syntaxe de
pandas.Series.value_counts(): -
Exemples de codes: compter les fréquences d’éléments uniques dans la série Pandas à l’aide de la méthode
Series.value_counts() -
Exemples de codes: définissez
normalize = Truedans la méthodeSeries.value_counts()pour obtenir les fréquences relatives des éléments -
Exemples de codes: définissez
ascending = Truedans la méthodeSeries.value_counts()pour trier les éléments en fonction de la valeur de fréquence dans l’ordre croissant -
Exemples de codes: définissez le paramètre
binsdans la méthodeSeries.value_counts()pour obtenir le nombre de valeurs se trouvant dans des compartiments semi-ouverts -
Exemples de codes: définissez
dropna = Falsedans la méthodeSeries.value_counts()pour compterNaN
La méthode pandas.Series.value_counts() compte le nombre d’occurrences de chaque élément unique dans la Series.
Syntaxe de pandas.Series.value_counts():
Series.value_counts(normalize=False, sort=True, ascending=False, bins=None, dropna=True)
Paramètres
normalize |
Booléen. Fréquences relatives des valeurs uniques (normalize = True) ou fréquences absolues des valeurs uniques (normalize = False). |
sort |
Booléen. Trier les éléments en fonction des fréquences (sort = True) ou laisser l’objet Series non trié (sort = False) |
ascending |
Booléen. Trier les valeurs par ordre croissant (ascending = True) ou décroissant (ascending = False) |
bins |
Entier. Nombre de partitions dans lesquelles la plage de valeurs de l’objet Series est divisée en |
dropna |
Booléen. Inclure les comptes de NaN (dropna = False) ou exclure les comptes de NaN (dropna = True) |
Revenir
Il retourne un objet Series composé du nombre de valeurs uniques.
Exemples de codes: compter les fréquences d’éléments uniques dans la série Pandas à l’aide de la méthode Series.value_counts()
import pandas as pd
import numpy as np
df = pd.DataFrame({'X': [1, 2, 3, np.nan, 3],
'Y': [4, np.nan, 8, np.nan, 3]})
print("DataFrame:")
print(df)
absolute_counts=df["X"].value_counts()
print("Frequencies of elements of X column:")
print(absolute_counts)
Production:
DataFrame:
X Y
0 1.0 4.0
1 2.0 NaN
2 3.0 8.0
3 NaN NaN
4 3.0 3.0
Frequencies of elements of X column:
3.0 2
2.0 1
1.0 1
Name: X, dtype: int64
L’objet Series absolute_counts donne le nombre de chaque élément unique de la colonne X en utilisant la méthode Series.value_counts().
Series.value_counts() ne compte pas NaN par défaut. Nous expliquerons comment le compter dans les sections suivantes.
Exemples de codes: définissez normalize = True dans la méthode Series.value_counts() pour obtenir les fréquences relatives des éléments
Si nous définissons normalize = True dans la méthode Series.value_counts(), nous obtenons les fréquences relatives de tous les éléments uniques dans l’objet Series.
import pandas as pd
import numpy as np
df = pd.DataFrame({'X': [1, 2, 3, np.nan, 3],
'Y': [4, np.nan, 8, np.nan, 3]})
print("DataFrame:")
print(df)
relative_counts=df["X"].value_counts(normalize=True)
print("Relative Frequencies of elements of X column:")
print(relative_counts)
Production:
DataFrame:
X Y
0 1.0 4.0
1 2.0 NaN
2 3.0 8.0
3 NaN NaN
4 3.0 3.0
Frequencies of elements of X column:
3.0 0.50
2.0 0.25
1.0 0.25
Name: X, dtype: float64
L’objet Series relative_counts donne les fréquences relatives de chaque élément unique de la colonne X.
Les fréquences relatives sont obtenues en divisant toutes les fréquences absolues par la somme des fréquences absolues.
Exemples de codes: définissez ascending = True dans la méthode Series.value_counts() pour trier les éléments en fonction de la valeur de fréquence dans l’ordre croissant
Si nous définissons ascending = True dans la méthode Series.value_counts(), nous obtenons l’objet Series avec ses éléments triés en fonction des valeurs de fréquence dans l’ordre croissant.
Par défaut, les valeurs de l’objet Series renvoyées par la méthode Series.value_counts() sont triées par ordre décroissant en fonction des valeurs de fréquence.
import pandas as pd
import numpy as np
df = pd.DataFrame({'X': [1, 2, 3, np.nan, 3],
'Y': [4, np.nan, 8, np.nan, 3]})
print("DataFrame:")
print(df)
sorted_counts=df["X"].value_counts(ascending=True)
print("Frequencies of elements of X column:")
print(sorted_counts)
Production:
DataFrame:
X Y
0 1.0 4.0
1 2.0 NaN
2 3.0 8.0
3 NaN NaN
4 3.0 3.0
Frequencies of elements of X column:
1.0 1
2.0 1
3.0 2
Name: X, dtype: int64
Il donne le nombre de chaque objet unique dans la colonne X avec des valeurs de fréquence triées par ordre croissant.
Exemples de codes: définissez le paramètre bins dans la méthode Series.value_counts() pour obtenir le nombre de valeurs se trouvant dans des compartiments semi-ouverts
import pandas as pd
import numpy as np
df = pd.DataFrame({'X': [1, 2, 3, np.nan, 3, 4, 5],
'Y': [4, np.nan, 8, np.nan, 3, 2, 1]})
print("DataFrame:")
print(df)
counts=df["X"].value_counts(bins=3)
print("Frequencies:")
print(counts)
Production:
DataFrame:
X Y
0 1.0 4.0
1 2.0 NaN
2 3.0 8.0
3 NaN NaN
4 3.0 3.0
5 4.0 2.0
6 5.0 1.0
Frequencies:
(3.667, 5.0] 2
(2.333, 3.667] 2
(0.995, 2.333] 2
Name: X, dtype: int64
Il divise la plage de valeurs de la série, c’est-à-dire la colonne X en trois parties et retourne le nombre de valeurs se trouvant dans chaque casier semi-ouvert.
Exemples de codes: définissez dropna = False dans la méthode Series.value_counts() pour compter NaN
Si nous définissons dropna = false dans la méthode Series.value_counts(), nous obtenons également le nombre de valeurs NaN.
import pandas as pd
import numpy as np
df = pd.DataFrame({'X': [1, 2, 3, np.nan, 3],
'Y': [4, np.nan, 8, np.nan, 3]})
print("DataFrame:")
print(df)
counts=df["Y"].value_counts(dropna=False)
print("Frequencies:")
print(counts)
Production:
DataFrame:
X Y
0 1.0 4.0
1 2.0 NaN
2 3.0 8.0
3 NaN NaN
4 3.0 3.0
Frequencies:
NaN 2
3.0 1
8.0 1
4.0 1
Name: Y, dtype: int64
Il donne le nombre de chaque élément dans la colonne Y de DataFrame avec le nombre de valeurs NaN.
Suraj Joshi is a backend software engineer at Matrice.ai.
LinkedIn