Pandas Groupby Describe

Zeeshan Afridi 21 junio 2023
  1. Usa Pandas groupby().describe() en Python
  2. Conclusión
Pandas Groupby Describe

Pandas es una de las bibliotecas más útiles y utilizadas para el análisis de datos; sin embargo, no es fácil analizar los datos, pero afortunadamente Pandas nos ha brindado muchas funciones útiles. Y una de las funciones útiles es la función groupby.describe().

El describe() se utiliza para resumir rápidamente los datos y proporcionar un análisis estadístico para cualquier variable o grupo. El describe() se puede aplicar a todo el conjunto de datos, columnas individuales o un grupo de columnas.

La sintaxis de groupby.describe() se encuentra a continuación.

df.groupby("var_a")["var_b"].describe()

Usa Pandas groupby().describe() en Python

Las funciones groupby() ayudan a agrupar el conjunto de datos en subgrupos en función de diferentes variables. Podemos agrupar el conjunto de datos en base a una o más de una variable, mientras que las funciones describe() nos brindan un análisis estadístico de los grupos.

Pero antes de entrar en los detalles del grupo y analizar los datos, primero, creemos un marco de datos.

# import pandas
import pandas as pd

# create DataFrame
df = pd.DataFrame(
    {
        "teams": ["A", "B", "C", "D", "E", "F"],
        "points": [8, 12, 14, 14, 15, 22],
        "assists": [2, 9, 3, 5, 7, 6],
    }
)

# view DataFrame
print(df)

Producción :

  	teams  points  assists
0    A       8        2
1    B      12        9
2    C      14        3
3    D      14        5
4    E      15        7
5    F      22        6

Hasta ahora, hemos creado un marco de datos; a continuación, agrupemos los datos usando la función groupby() y veamos el análisis estadístico usando describe().

# import pandas
import pandas as pd

# create DataFrame
df = pd.DataFrame(
    {
        "teams": ["A", "B", "C", "D", "E", "F"],
        "points": [8, 12, 14, 14, 15, 22],
        "assists": [2, 9, 3, 5, 7, 6],
    }
)


# create a group
group = df.groupby("points")
print(group.first())
print("\n\n********** Group stats **********")

# see the stats using
group_stats = df.groupby("points").describe()
print(group_stats)

Producción :

team  assists
points
8         A        2
12        B        9
14        C        3
15        E        7
22        F        6


********** Group stats **********
         assists
         count mean       std  min  25%  50%  75%  max
points
8          1.0  2.0       NaN  2.0  2.0  2.0  2.0  2.0
12         1.0  9.0       NaN  9.0  9.0  9.0  9.0  9.0
14         2.0  4.0  1.414214  3.0  3.5  4.0  4.5  5.0
15         1.0  7.0       NaN  7.0  7.0  7.0  7.0  7.0
22         1.0  6.0       NaN  6.0  6.0  6.0  6.0  6.0

Como puede ver en el ejemplo anterior, estamos agrupando los datos en función de puntos y luego aplicando describe() de la siguiente manera group_stats = df.groupby('points').describe(). Ahora, como puede ver, estamos viendo las estadísticas como min, max, std, etc.

Conclusión

Para resumir el artículo sobre cómo agrupar datos y ver las estadísticas usando la función groupby.describe(), hemos discutido qué son las funciones groupby() y describe() y cómo funcionan. Además, hemos discutido las diferentes funciones estadísticas utilizadas por la función describe() para analizar los datos en Python.

Zeeshan Afridi avatar Zeeshan Afridi avatar

Zeeshan is a detail oriented software engineer that helps companies and individuals make their lives and easier with software solutions.

LinkedIn

Artículo relacionado - Pandas Groupby