Berechnen Sie den Mittelwert einer gruppierten Daten in Pandas

Fariba Laiq 15 Februar 2024
  1. Verwenden Sie groupby.mean(), um den Mittelwert einer einzelnen Spalte in Pandas zu berechnen
  2. Verwenden Sie groupby.mean(), um den Mittelwert mehrerer Spalten in Pandas zu berechnen
  3. Verwenden Sie die agg()-Methode, um den Mittelwert einer gruppierten Daten in Pandas zu berechnen
Berechnen Sie den Mittelwert einer gruppierten Daten in Pandas

Pandas ist eine Open-Source-Datenanalysebibliothek in Python. Es bietet viele integrierte Methoden, um Operationen mit numerischen Daten durchzuführen.

groupby() ist eine der in Pandas verfügbaren Methoden, die die Daten nach bestimmten Kriterien in mehrere Gruppen aufteilt. Danach können wir verschiedene Methoden auf die gruppierten Daten anwenden, wie count(), mean() usw.

Dieses Tutorial zeigt, wie man den Mittelwert gruppierter Daten mit der Methode groupby.mean() in Pandas findet.

Verwenden Sie groupby.mean(), um den Mittelwert einer einzelnen Spalte in Pandas zu berechnen

Hier haben wir die Daten der Schüler im Pandas-Datenrahmenobjekt, wobei die Daten nach Abteilung gruppiert sind. Wir werden zwei Gruppen für zwei Abteilungen haben.

Dann berechnen wir die Durchschnittsnoten der Studenten jeder Gruppe oder Abteilung durch die Methode groupby.mean() in einer einzigen Spalte, d.h. Noten. In der Ausgabe erhalten wir die Durchschnittsnoten der Studierenden der CS- und SE-Fachbereiche.

Beispielcode:

# Python 3.x
import pandas as pd

df = pd.DataFrame(
    {
        "Name": ["Robert", "Sam", "Alia", "Jhon", "Smith"],
        "Department": ["CS", "SE", "SE", "SE", "CS"],
        "Marks": [60, 81, 79, 51, 88],
        "Age": [20, 21, 20, 22, 23],
    }
)
display(df)
df.groupby("Department")["Marks"].mean()

Ausgang:

Pandas Einzelspaltenmittelwert - Ausgabe

Verwenden Sie groupby.mean(), um den Mittelwert mehrerer Spalten in Pandas zu berechnen

Wir können auch den Mittelwert mehrerer Spalten gleichzeitig nehmen, nachdem wir die Daten gruppiert haben, indem wir die Namen aller Probleme angeben, für die wir den Mittelwert berechnen möchten. Im folgenden Code haben wir die Daten nach Fachbereich aufgesplittet und daraus die durchschnittlichen Noten und Alter der Studierenden errechnet.

Beispielcode:

# Python 3.x
import pandas as pd

df = pd.DataFrame(
    {
        "Name": ["Robert", "Sam", "Alia", "Jhon", "Smith"],
        "Department": ["CS", "SE", "SE", "SE", "CS"],
        "Marks": [60, 81, 79, 51, 88],
        "Age": [20, 21, 20, 22, 23],
    }
)
display(df)
df.groupby("Department")["Marks", "Age"].mean()

Ausgang:

Pandas Mittelwert aus mehreren Spalten - Ausgabe

Verwenden Sie die agg()-Methode, um den Mittelwert einer gruppierten Daten in Pandas zu berechnen

Alternativ können wir auch die Methode agg() verwenden, um den Mittelwert auf einer Gruppe durch das Objekt zu berechnen. Wir übergeben mean als Argument an die agg()-Methode.

Beispielcode:

# Python 3.x
import pandas as pd

df = pd.DataFrame(
    {
        "Name": ["Robert", "Sam", "Alia", "Jhon", "Smith"],
        "Department": ["CS", "SE", "SE", "SE", "CS"],
        "Marks": [60, 81, 79, 51, 88],
        "Age": [20, 21, 20, 22, 23],
    }
)
display(df)
df.groupby("Department")["Marks"].agg("mean")

Ausgang:

Pandas Gruppierter Datenmittelwert mit agg() - Ausgabe

Fariba Laiq avatar Fariba Laiq avatar

I am Fariba Laiq from Pakistan. An android app developer, technical content writer, and coding instructor. Writing has always been one of my passions. I love to learn, implement and convey my knowledge to others.

LinkedIn

Verwandter Artikel - Pandas Statistics

Verwandter Artikel - Pandas GroupBy