Trazar datos agrupados en pandas

Fariba Laiq 15 febrero 2024
  1. Trazar datos agrupados usando un gráfico de barras en Pandas
  2. Trazar datos agrupados usando un gráfico circular en Pandas
Trazar datos agrupados en pandas

Pandas es una biblioteca de análisis de datos de código abierto en Python. Proporciona muchos métodos integrados para realizar operaciones en datos numéricos.

groupby() es uno de los métodos disponibles en Pandas que divide los datos en varios grupos según algunos criterios. Podemos trazar aún más los datos agrupados para una mejor visualización de datos usando Matplotlib en Python.

Este tutorial demostrará cómo trazar los datos de un grupo de datos en Pandas Python.

Trazar datos agrupados usando un gráfico de barras en Pandas

Tenemos los datos de los estudiantes en el marco de datos de Pandas en el siguiente ejemplo. En primer lugar, agruparemos los datos según el departamento utilizando el método groupby('Department').

Ahora, los datos se dividirán en dos grupos. Luego calcularemos las notas máximas conseguidas en cada departamento utilizando la función max() sobre los datos agrupados.

Finalmente, mostraremos la puntuación más alta de cada departamento usando la función plot() y especificaremos el tipo de gráfico como un gráfico de barras en el argumento. Como salida, obtendremos un gráfico de barras que muestra la puntuación máxima de cada departamento.

Código de ejemplo:

# Python 3.x
import pandas as pd
import matplotlib.pyplot as plt

df = pd.DataFrame(
    {
        "Name": ["Robert", "Sam", "Alia", "Jhon", "Smith"],
        "Department": ["CS", "SE", "SE", "SE", "CS"],
        "Marks": [60, 70, 59, 51, 80],
        "Age": [20, 21, 20, 22, 23],
    }
)
display(df)
df.groupby("Department")["Marks"].max().plot(kind="bar", legend=True)
plt.show()

Producción:

Gráfico de pandas usando gráfico de barras

Trazar datos agrupados usando un gráfico circular en Pandas

En este ejemplo tenemos los datos de los alumnos con sus notas en cada asignatura. Primero, agruparemos los datos de acuerdo con los nombres, calcularemos las calificaciones promedio de cada estudiante y las representaremos usando un gráfico circular.

Cada color o sector del gráfico circular indica las notas medias de cada alumno.

Código de ejemplo:

# Python 3.x
import pandas as pd
import matplotlib.pyplot as plt

df = pd.DataFrame(
    {
        "Name": ["Robert", "Robert", "Alia", "Alia", "Smith", "Smith"],
        "Subject": ["Java", "Python", "Java", "Python", "Java", "Python"],
        "Marks": [60, 70, 59, 51, 80, 70],
    }
)
display(df)
df.groupby("Name")["Marks"].mean().plot(kind="pie")
plt.show()

Producción:

Diagrama de pandas usando un gráfico circular

Fariba Laiq avatar Fariba Laiq avatar

I am Fariba Laiq from Pakistan. An android app developer, technical content writer, and coding instructor. Writing has always been one of my passions. I love to learn, implement and convey my knowledge to others.

LinkedIn

Artículo relacionado - Pandas Plot