Wie man die Häufigkeit zählt, mit der ein Wert im Pandas-DataFrame auftritt

Ahmed Waheed 30 Januar 2023 Pandas Pandas DataFrame

Methode df.groupby().count()
Methode Series.value_counts()
Methode df.groupby().size()

Wie man die Häufigkeit zählt, mit der ein Wert im Pandas-DataFrame auftritt

Manchmal, wenn Sie mit DataFrame arbeiten, möchten Sie vielleicht zählen, wie oft ein Wert in der Spalte vorkommt, oder mit anderen Worten, um die Häufigkeit zu berechnen. Zu diesem Zweck werden im Wesentlichen drei Methoden verwendet. Schauen wir sie uns nacheinander an.

df.groupby().count()
Serien.werte_zählungen()
df.groupby().size()

In den nächsten Abschnitten werden wir denselben DataFrame wie folgt verwenden,

import pandas as pd

df = pd.DataFrame(
    {
        "A": ["jim", "jim", "jim", "jim", "sal", "tom", "tom", "sal", "sal"],
        "B": ["a", "b", "a", "b", "b", "b", "a", "a", "b"],
    }
)

Methode `df.groupby().count()`

Wenn Sie die Häufigkeit über eine einzelne Spalte berechnen möchten, ist diese Methode am besten geeignet.

import pandas as pd

df = pd.DataFrame(
    {
        "A": ["jim", "jim", "jim", "jim", "sal", "tom", "tom", "sal", "sal"],
        "B": ["a", "b", "a", "b", "b", "b", "a", "a", "b"],
    }
)

freq = df.groupby(["A"]).count()
print(freq)

freq = df.groupby(["B"]).count()
print(freq)

Es wird folgendes ausgegeben.

     B
A     
jim  4
sal  3
tom  2
   A
B   
a  4
b  5

Methode `Series.value_counts()`

Da jedes DataFrame-Objekt eine Sammlung von Series-Objekten ist, wird diese Methode am besten für pandas.Series-Objekte verwendet.

Verwenden Sie jetzt die Series.values_counts() Funktion

import pandas as pd

df = pd.DataFrame(
    {
        "A": ["jim", "jim", "jim", "jim", "sal", "tom", "tom", "sal", "sal"],
        "B": ["a", "b", "a", "b", "b", "b", "a", "a", "b"],
    }
)

freq = df["A"].value_counts()
print(freq)

freq = df["B"].value_counts()
print(freq)

Folgendes wird ausgegeben.

jim    4
sal    3
tom    2
Name: A, dtype: int64
b    5
a    4
Name: B, dtype: int64

Methode `df.groupby().size()`

Die beiden obigen Methoden können nicht verwendet werden, um die Häufigkeit mehrerer Spalten zu zählen, aber wir können df.groupby().size() für mehrere Spalten gleichzeitig verwenden.

import pandas as pd

df = pd.DataFrame(
    {
        "A": ["jim", "jim", "jim", "jim", "sal", "tom", "tom", "sal", "sal"],
        "B": ["a", "b", "a", "b", "b", "b", "a", "a", "b"],
    }
)

freq = df.groupby(["A", "B"]).size()
print(freq)

Das Folgende wird ausgegeben.

A    B
jim  a    2
     b    2
sal  a    1
     b    2
tom  a    1
     b    1
dtype: int64

Genießen Sie unsere Tutorials? Abonnieren Sie DelftStack auf YouTube, um uns bei der Erstellung weiterer hochwertiger Videoanleitungen zu unterstützen. Abonnieren

Methode df.groupby().count()

Methode Series.value_counts()

Methode df.groupby().size()

Verwandter Artikel - Pandas DataFrame

Methode `df.groupby().count()`

Methode `Series.value_counts()`

Methode `df.groupby().size()`