Tracciare il grafico utilizzando la funzione seaborn.lmplot()

Manav Narula 15 febbraio 2024
Tracciare il grafico utilizzando la funzione seaborn.lmplot()

Il modulo Seaborn viene utilizzato per creare grafici statistici in Python. È costruito sul modulo matplotlib, quindi è molto semplice da usare.

La funzione seaborn.lmplot() crea un grafico a dispersione di base utilizzando i dati forniti su una FacetGrid.

Vedere il seguente codice.

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import random

x = range(50)
y = random.sample(range(100), 50)
cat = [i for i in range(2)] * 25
df = pd.DataFrame({"x": x, "y": y, "Category": cat})

sns.lmplot(x="x", y="y", data=df, fit_reg=False, hue="Category")

funzione lmplot di origine marina

Tuttavia, l’uso di questa funzione va oltre il tracciamento dei grafici a dispersione. Può anche essere utilizzato per comprendere la relazione tra i dati tracciando una linea di regressione facoltativa nel grafico. Può essere utilizzato anche per la regressione logistica.

A differenza della funzione seaborn.regplot() che viene utilizzata anche per eseguire una semplice regressione e tracciare i dati, la funzione seaborn.lmplot() combina la classe seaborn.FacetGrid() con la classe seaborn.regplot() funzione.

La FacetGrid() viene utilizzata per visualizzare la relazione tra la distribuzione dei dati con altri sottoinsiemi di dati e può essere utilizzata per creare griglie per più grafici. Funziona su tre assi fornendo righe, colonne e tonalità. È molto utile quando lavoriamo con un set di dati complicato.

Possiamo anche personalizzare la figura finale utilizzando i diversi parametri con la funzione seaborn.lmplot(). Possiamo fornire le personalizzazioni necessarie, come il colore del grafico, come coppie chiave-valore di un dizionario al parametro line_kws e scatter_kws.

Nel codice seguente, tracceremo un grafico con una linea di regressione usando questa funzione.

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import random

x = range(50)
y = random.sample(range(100), 50)
cat = [i for i in range(2)] * 25
df = pd.DataFrame({"x": x, "y": y, "Category": cat})

sns.lmplot(x="x", y="y", data=df, hue="Category")

funzione lmplot di origine marina

Nota che il parametro fit_reg è impostato su True per impostazione predefinita. Il nostro set di dati aveva più categorie, quindi siamo stati in grado di tracciare più linee di regressione. Se avessimo rimosso il parametro hue, si sarebbe ottenuto un unico grafico di regressione. Possiamo inoltre utilizzare molti parametri anche per la nostra regressione. Alcuni di questi includono l’argomento jitter, che viene utilizzato per aggiungere un po’ di rumore ai dati, o il parametro estimator utilizzato per tracciare un dato valore stimato.

Autore: Manav Narula
Manav Narula avatar Manav Narula avatar

Manav is a IT Professional who has a lot of experience as a core developer in many live projects. He is an avid learner who enjoys learning new things and sharing his findings whenever possible.

LinkedIn