Función Pandas DataFrame DataFrame.boxplot()

Suraj Joshi 30 enero 2023
  1. La sintaxis de pandas.DataFrame.boxplot():
  2. Códigos de ejemplo: Generar Boxplot con pandas.DataFrame.boxplot()
  3. Códigos de ejemplo: Genera Boxplot agrupando datos basados en valores de columna con pandas.DataFrame.boxplot()
  4. Poner el parámetro layout para cambiar la disposición de los boxplots
Función Pandas DataFrame DataFrame.boxplot()

pandas.DataFrame.boxplot() hace un gráfico de cajas y bigotes de las columnas de DataFrame. Un gráfico de caja y bigotes resume el valor mínimo, el primer cuartil, la mediana, el tercer cuartil y el valor máximo de los datos.

La sintaxis de pandas.DataFrame.boxplot():

DataFrame.boxplot(
    column=None,
    by=None,
    ax=None,
    fontsize=None,
    rot=0,
    grid=True,
    figsize=None,
    layout=None,
    return_type=None,
    backend=None,
    **kwargs
)

Parámetros

column El nombre de la columna de la que se debe generar el boxplot
by Traza diferentes boxplots agrupando by columnas en diferentes grupos.
ax Los ejes de Matplotlib serán usados por boxplot
grid Booleana. Enciende las rejillas (True) y apaga (False)
rot Entero. El ángulo de rotación de la etiqueta a lo largo del eje X
fontsize El tamaño de la letra de las etiquetas en Boxplot
layout Parámetro utilizado para controlar o establecer la disposición de Boxplot
return_type Tipo de objeto a devolver
backend Backend a utilizar en lugar del backend especificado en la opción plotting.backend.
**kwargs Argumentos de palabras clave para el método

Códigos de ejemplo: Generar Boxplot con pandas.DataFrame.boxplot()

import pandas as pd
import matplotlib.pyplot as plt

fruits=['Apple', 'Papaya', 'Banana', 'Mango','Litchi','Avocado']
prices=[3, 1, 2, 4,4,5]

df = pd.DataFrame({'Fruit':fruits ,
                   'Price': prices})
print(df)

boxplot = df.boxplot(column=['Price'])
boxplot.plot()

plt.show()

Producción:

Generar Boxplot con Boxplot DataFrame

Genera una gráfica de la columna Price de DataFrame. Usamos matplotlib.pyplot para mostrar el gráfico generado.

Códigos de ejemplo: Genera Boxplot agrupando datos basados en valores de columna con pandas.DataFrame.boxplot()

import pandas as pd
import numpy as np
import sklearn

dates=['April-10', 'April-10', 'April-11', 'April-11','April-11']
prices=[3, 1, 2, 4,5]

df = pd.DataFrame({'Date':dates ,
                   'Price': prices})
print(df)

boxplot = df.boxplot(column=['Price'],by="Date")
boxplot.plot()

plt.show()

Producción:

Generar Boxplot con DataFrame boxplot usando groupby

Al principio, agrupa el DataFrame dado en diferentes grupos basados en su valor de la columna Date y luego genera un cuadro para cada DataFrame.

Podemos personalizar nuestra gráfica usando los parámetros fontsize, rot y grid.

import pandas as pd
import matplotlib.pyplot as plt

dates=['April-10', 'April-10', 'April-11', 'April-11','April-11']
prices=[3, 1, 2, 4,5]

df = pd.DataFrame({'Date':dates ,
                   'Price': prices})
print(df)

boxplot = df.boxplot(column=['Price'],by="Date",grid=False, rot=45, fontsize=15)
boxplot.plot()

plt.show()

Producción:

Personalizar los pandas del boxplot

Aquí, grid=False apaga la cuadrícula, rot=45 rota las etiquetas del eje X en 45 grados, y fontsize=15 cambia el tamaño de la fuente a 15.

Poner el parámetro layout para cambiar la disposición de los boxplots

import pandas as pd

dates=['April-10', 'April-10', 'April-11', 'April-11','April-11']
prices=[3, 1, 2, 4,5]


df = pd.DataFrame({'Date':dates ,

boxplot = df.boxplot(column=['Price'],by="Date",layout=(2,1),grid=False,fontsize=15)

Producción:

Establecer el parámetro de diseño para cambiar el diseño de los boxplots

Aquí, el parámetro layout cambia la disposición del boxplot generado. layout=(2,1) alinea los boxplots en 2 filas y una columna.

Suraj Joshi avatar Suraj Joshi avatar

Suraj Joshi is a backend software engineer at Matrice.ai.

LinkedIn

Artículo relacionado - Pandas DataFrame