Pandas DataFrame DataFrame.boxplot() Função

Suraj Joshi 30 janeiro 2023
  1. Sintaxe de pandas.DataFrame.boxplot():
  2. Códigos de exemplo: Gerar Boxplot com pandas.DataFrame.boxplot()
  3. Códigos de exemplo: Gera dados de agrupamento de boxplot com base nos valores da coluna com pandas.DataFrame.boxplot()
  4. Define o parâmetro layout para alterar o layout das Boxplots
Pandas DataFrame DataFrame.boxplot() Função

pandas.DataFrame.boxplot() faz um gráfico box-and-wisker a partir das colunas DataFrame. Um gráfico box and whisker resume o mínimo, primeiro quartil, mediana, terceiro quartil, e o valor máximo dos dados.

Sintaxe de pandas.DataFrame.boxplot():

DataFrame.boxplot(
    column=None,
    by=None,
    ax=None,
    fontsize=None,
    rot=0,
    grid=True,
    figsize=None,
    layout=None,
    return_type=None,
    backend=None,
    **kwargs
)

Parâmetros

column Nome da coluna a partir da qual boxplot tem de ser gerado
by Lotes diferentes agrupando colunas por colunas em diferentes grupos.
ax Eixos Matplotlib a serem utilizados pelo boxplot.
grid Booleano. Ligar (True) e desligar (False) as grelhas
rot Inteiro. Ângulo de rotação para a etiqueta ao longo do eixo X
fontsize Tamanho de letra das etiquetas em Boxplot
layout Parâmetro utilizado para controlar ou definir a disposição do Boxplot
return_type Tipo de objecto a devolver
backend Backend a utilizar em vez do backend especificado na opção plotting.backend.
**kwargs Argumentos por palavra-chave para o método

Códigos de exemplo: Gerar Boxplot com pandas.DataFrame.boxplot()

import pandas as pd
import matplotlib.pyplot as plt

fruits=['Apple', 'Papaya', 'Banana', 'Mango','Litchi','Avocado']
prices=[3, 1, 2, 4,4,5]

df = pd.DataFrame({'Fruit':fruits ,
                   'Price': prices})
print(df)

boxplot = df.boxplot(column=['Price'])
boxplot.plot()

plt.show()

Resultado:

Gerar Boxplot com DataFrame boxplot

Gera um boxplot a partir da coluna prices de DataFrame. Utilizamos matplotlib.pyplot para mostrar a parcela gerada.

Códigos de exemplo: Gera dados de agrupamento de boxplot com base nos valores da coluna com pandas.DataFrame.boxplot()

import pandas as pd
import numpy as np
import sklearn

dates=['April-10', 'April-10', 'April-11', 'April-11','April-11']
prices=[3, 1, 2, 4,5]

df = pd.DataFrame({'Date':dates ,
                   'Price': prices})
print(df)

boxplot = df.boxplot(column=['Price'],by="Date")
boxplot.plot()

plt.show()

Resultado:

Gerar Boxplot com DataFrame boxplot usando grupo por

No início, agrupa o DataFrame dado em diferentes grupos com base no seu valor da coluna Date e depois gera um boxplot para cada DataFrame.

Podemos personalizar a nossa parcela utilizando parâmetros fontsize, rot, e grid.

import pandas as pd
import matplotlib.pyplot as plt

dates=['April-10', 'April-10', 'April-11', 'April-11','April-11']
prices=[3, 1, 2, 4,5]

df = pd.DataFrame({'Date':dates ,
                   'Price': prices})
print(df)

boxplot = df.boxplot(column=['Price'],by="Date",grid=False, rot=45, fontsize=15)
boxplot.plot()

plt.show()

Resultado:

Personalizar boxplot pandas

Aqui, grid=False desliga a grelha, rot=45 roda as etiquetas do eixo X em 45 graus, e fontsize=15 muda o tamanho da fonte para 15.

Define o parâmetro layout para alterar o layout das Boxplots

import pandas as pd

dates=['April-10', 'April-10', 'April-11', 'April-11','April-11']
prices=[3, 1, 2, 4,5]


df = pd.DataFrame({'Date':dates ,

boxplot = df.boxplot(column=['Price'],by="Date",layout=(2,1),grid=False,fontsize=15)

Resultado:

Definir parâmetro de layout para alterar o layout de boxplots

Aqui, o parâmetro layout altera a disposição do boxplot gerado. layout=(2,1) alinha o boxplot em 2 filas e uma coluna.

Suraj Joshi avatar Suraj Joshi avatar

Suraj Joshi is a backend software engineer at Matrice.ai.

LinkedIn

Artigo relacionado - Pandas DataFrame