Pandas DataFrame Funzione DataFrame.plot.hist()

Minahil Noor 30 gennaio 2023
  1. Sintassi di pandas.DataFrame.plot.hist()
  2. Codici di esempio: DataFrame.plot.hist()
  3. Codici di esempio: DataFrame.plot.hist() per disegnare un istogramma complesso
  4. Codici di esempio: DataFrame.plot.hist() per modificare il numero di contenitori
Pandas DataFrame Funzione DataFrame.plot.hist()

La funzione Python Pandas DataFrame.plot.hist() disegna un singolo istogramma delle colonne di un DataFrame. Un istogramma rappresenta i dati in forma grafica. Crea barre di intervalli. La barra più alta mostra che più dati rientrano nell’intervallo di questa barra.

Sintassi di pandas.DataFrame.plot.hist()

DataFrame.sample(by=None, bins=10, **kwargs)

Parametri

by È una stringa o una sequenza. Rappresenta le colonne del DataFrame da raggruppare.
bins È un numero intero. Rappresenta il numero di contenitori dell’istogramma. Un contenitore è come un intervallo, ad esempio 0-5, 6-10, ecc.
**kwargs Questi sono gli argomenti della parola chiave aggiuntivi per personalizzare l’istogramma. Puoi controllare questi qui.

Ritorno

Restituisce un istogramma tracciato e dati AxesSubplot.

Codici di esempio: DataFrame.plot.hist()

Per prima cosa tracciamo un istogramma usando un semplice DataFrame.

import pandas as pd
dataframe = pd.DataFrame({'Value':[100, 200, 300]})
print(dataframe)

Il nostro DataFrame è il seguente.

 Value
0  100
1  200
2  300

Tutti i parametri di questa funzione sono opzionali. Se eseguiamo questa funzione senza passare alcun parametro, produce il seguente output.

import pandas as pd
from matplotlib import pyplot as plt

dataframe = pd.DataFrame({"Value": [100, 200, 300]})

histogram = dataframe.plot.hist()
print(histogram)
plt.show()

Produzione:

AxesSubplot(0.125,0.125;0.775x0.755)

Pandas DataFrame.plot.hist Basic

Codici di esempio: DataFrame.plot.hist() per disegnare un istogramma complesso

Ora convertiremo il nostro DataFrame in uno complesso.

import pandas as pd
import numpy as np

dataframe = pd.DataFrame(np.random.randint(0, 200, size=(200, 3)), columns=list("ABC"))

print(dataframe)

Il nostro DataFrame diventa,

 A    B    C
0     15  163  163
1     29    7   54
2    195   40    6
3    183   92   57
4     72  167   40
..   ...  ...  ...
195   79   35    7
196  122   79  142
197  121   46  124
198  138  141  114
199  148   95  129

[200 rows x 3 columns]

Abbiamo usato la funzione NumPy.random.randint() per creare un DataFrame che contiene numeri interi casuali. Ora disegneremo l’istogramma di questo DataFrame usando la funzione DataFrame.plot.hist().

import pandas as pd
import numpy as np

from matplotlib import pyplot as plt

dataframe = pd.DataFrame(np.random.randint(0, 200, size=(200, 3)), columns=list("ABC"))

histogram = dataframe.plot.hist()
print(histogram)
plt.show()

Produzione:

AxesSubplot(0.125,0.125;0.775x0.755)

Pandas DataFrame.plot.hist Basic 2

La funzione ha disegnato un istogramma che ha 10 contenitori per impostazione predefinita. Mostra la distribuzione di frequenza di tre colonne del DataFrame. Ogni colonna è rappresentata da un colore specifico.

Codici di esempio: DataFrame.plot.hist() per modificare il numero di contenitori

import pandas as pd
import numpy as np
from matplotlib import pyplot as plt

dataframe = pd.DataFrame(np.random.randint(0, 200, size=(200, 3)), columns=list("ABC"))

histogram = dataframe.plot.hist(bins=2)
print(histogram)
plt.show()

Produzione:

AxesSubplot(0.125,0.125;0.775x0.755)

Pandas DataFrame.plot.hist con contenitori di parametri

import pandas as pd
import numpy as np
from matplotlib import pyplot as plt

dataframe = pd.DataFrame(np.random.randint(0, 200, size=(200, 3)), columns=list("ABC"))

histogram = dataframe.plot.hist(bins=50)
print(histogram)
plt.show()

Produzione:

AxesSubplot(0.125,0.125;0.775x0.755)

Pandas DataFrame.plot.hist con parametro 50 bin

Nel primo codice di esempio, abbiamo cambiato il numero di bin a 2 e nel secondo codice di esempio, è 50. Notare che maggiore è il numero di bin, più facile è capire l’istogramma. Il primo istogramma è ambiguo in quanto non siamo in grado di vedere le barre della colonna A.

Articolo correlato - Pandas DataFrame

Articolo correlato - Pandas DataFrame Plot