Pandas DataFrame DataFrame.plot.hist() Função

Minahil Noor 30 janeiro 2023
  1. Sintaxe de pandas.DataFrame.plot.hist()
  2. Códigos de exemplo: DataFrame.plot.hist()
  3. Códigos de Exemplo: DataFrame.plot.hist() para desenhar um Histograma Complexo
  4. Códigos de exemplo: DataFrame.plot.hist() para Alterar o Número de Lixeiras
Pandas DataFrame DataFrame.plot.hist() Função

Python Pandas DataFrame.plot.hist() a função Pandas desenha um único histograma das colunas de um DataFrame. Um histograma representa os dados sob a forma gráfica. Cria barras de intervalos. A barra mais alta mostra que mais dados se enquadram na gama desta barra.

Sintaxe de pandas.DataFrame.plot.hist()

DataFrame.sample(by=None, bins=10, **kwargs)

Parâmetros

by É um string ou uma sequência. Representa as colunas do DataFrame para agrupar por.
bins É um número inteiro. Representa o número de caixas de histograma. Um contentor é como um intervalo, por exemplo, 0-5, 6-10, etc.
**kwargs Estes são os argumentos adicionais da palavra-chave para personalizar o histograma. Pode verificar estes aqui.

Devolver

Devolve um histograma plotado e dados de AxesSubplot.

Códigos de exemplo: DataFrame.plot.hist()

Vamos primeiro traçar um histograma utilizando um simples DataFrame.

import pandas as pd
dataframe = pd.DataFrame({'Value':[100, 200, 300]})
print(dataframe)

O nosso DataFrame é o que se segue.

 Value
0  100
1  200
2  300

Todos os parâmetros desta função são opcionais. Se executarmos esta função sem passarmos qualquer parâmetro, então ela produz o seguinte resultado.

import pandas as pd
from matplotlib import pyplot as plt

dataframe = pd.DataFrame({"Value": [100, 200, 300]})

histogram = dataframe.plot.hist()
print(histogram)
plt.show()

Resultado:

AxesSubplot(0.125,0.125;0.775x0.755)

Pandas DataFrame.plot.hist Básico

Códigos de Exemplo: DataFrame.plot.hist() para desenhar um Histograma Complexo

Agora, vamos converter o nosso DataFrame para um complexo.

import pandas as pd
import numpy as np

dataframe = pd.DataFrame(np.random.randint(0, 200, size=(200, 3)), columns=list("ABC"))

print(dataframe)

O nosso DataFrame torna-se,

 A    B    C
0     15  163  163
1     29    7   54
2    195   40    6
3    183   92   57
4     72  167   40
..   ...  ...  ...
195   79   35    7
196  122   79  142
197  121   46  124
198  138  141  114
199  148   95  129

[200 rows x 3 columns]

Utilizámos a função NumPy.random.randint() para criar um DataFrame que contém inteiros aleatórios. Agora, vamos desenhar o histograma desta função DataFrame utilizando DataFrame.plot.hist().

import pandas as pd
import numpy as np

from matplotlib import pyplot as plt

dataframe = pd.DataFrame(np.random.randint(0, 200, size=(200, 3)), columns=list("ABC"))

histogram = dataframe.plot.hist()
print(histogram)
plt.show()

Resultado:

AxesSubplot(0.125,0.125;0.775x0.755)

Pandas DataFrame.plot.hist Basic 2

A função desenhou um histograma que tem 10 silos por defeito. Mostra a distribuição de frequência de três colunas do DataFrame. Cada coluna é representada por uma cor específica.

Códigos de exemplo: DataFrame.plot.hist() para Alterar o Número de Lixeiras

import pandas as pd
import numpy as np
from matplotlib import pyplot as plt

dataframe = pd.DataFrame(np.random.randint(0, 200, size=(200, 3)), columns=list("ABC"))

histogram = dataframe.plot.hist(bins=2)
print(histogram)
plt.show()

Resultado:

AxesSubplot(0.125,0.125;0.775x0.755)

Pandas DataFrame.plot.hist com caixas de parâmetros

import pandas as pd
import numpy as np
from matplotlib import pyplot as plt

dataframe = pd.DataFrame(np.random.randint(0, 200, size=(200, 3)), columns=list("ABC"))

histogram = dataframe.plot.hist(bins=50)
print(histogram)
plt.show()

Resultado:

AxesSubplot(0.125,0.125;0.775x0.755)

Pandas DataFrame.plot.hist com parâmetro 50 bins

No primeiro exemplo de código, alterámos o número de caixas para 2 e no segundo exemplo de código, é 50. Note-se que quanto maior o número de caixas, mais fácil é compreender o histograma. O primeiro histograma é ambíguo, uma vez que não conseguimos ver a coluna A barras.

Artigo relacionado - Pandas DataFrame

Artigo relacionado - Pandas DataFrame Plot