Visualisation de tracé KDE avec Pandas et Seaborn

Samreena Aslam 30 janvier 2023
  1. Visualisation des données à l’aide du tracé KDE normal et de Seaborn en Python
  2. Tracé KDE unidimensionnel utilisant Pandas et Seaborn en Python
  3. Tracé KDE bidimensionnel ou bivarié utilisant Pandas et Seaborn en Python
  4. Conclusion
Visualisation de tracé KDE avec Pandas et Seaborn

KDE est Kernel Density Estimate, utilisé pour visualiser la densité de probabilité de variables de données continues et non paramétriques. Lorsque vous souhaitez visualiser les distributions multiples, la fonction KDE produit un tracé moins encombré et plus interprétable.

En utilisant KDE, nous pouvons visualiser plusieurs échantillons de données à l’aide d’un seul graphique, ce qui est une méthode plus efficace de visualisation de données.

Seaborn est une bibliothèque python comme matplotlib. Seaborn peut être intégré avec pandas et numpy pour les représentations de données.

Les scientifiques des données utilisent cette bibliothèque pour créer des tableaux et des graphiques statistiques informatifs et beaux. Grâce à ces présentations, vous pouvez comprendre les concepts clairs et le flux d’informations au sein des différents modules.

Nous pouvons tracer des graphiques univariés et bivariés en utilisant la fonction KDE, Seaborn et Pandas.

Nous en apprendrons davantage sur la visualisation de l’intrigue de KDE avec des pandas et des marins. Cet article utilisera quelques exemples de l’ensemble de données mtcars pour montrer la visualisation du tracé de KDE.

Avant de commencer avec les détails, vous devez installer ou ajouter les bibliothèques seaborn et sklearn à l’aide de la commande pip.

pip install seaborn
pip install sklearn

Visualisation des données à l’aide du tracé KDE normal et de Seaborn en Python

Nous pouvons tracer les données en utilisant la fonction de tracé normale de KDE avec la bibliothèque Seaborn.

Dans l’exemple suivant, nous avons créé 1000 échantillons de données à l’aide de la bibliothèque random puis les avons disposés dans le tableau de numpy car la bibliothèque Seaborn ne fonctionne bien qu’avec numpy et Pandas dataframes.

Exemple de code :

import seaborn as sn
import matplotlib.pyplot as plt
import numpy as np

data = np.random.randn(1000)
# KDE Plot with seaborn
res = sn.kdeplot(data, color="red", shade="True")
plt.show()

Production :

Visualisation de tracé KDE avec pandas et seaborn - Tracé KDE avec Seaborn

Nous pouvons également visualiser l’échantillon de données ci-dessus verticalement ou inverser le tracé ci-dessus à l’aide de la bibliothèque KDE et Seaborn. Nous avons utilisé la propriété de tracé vertical=True pour inverser le tracé ci-dessus.

Exemple de code :

import seaborn as sn
import matplotlib.pyplot as plt
import numpy as np

data = np.random.randn(1000)
# KDE Plot with seaborn
res = sn.kdeplot(data, color="green", vertical=True, shade="True")
plt.show()

Production :

Visualisation de tracé KDE avec pandas et seaborn - Tracé KDE avec Seaborn

Tracé KDE unidimensionnel utilisant Pandas et Seaborn en Python

Nous pouvons visualiser la distribution de probabilité pour une cible unique ou un attribut continu à l’aide du graphique KDE. Dans l’exemple suivant, nous avons lu un fichier CSV du jeu de données mtcars.

Il y a plus de 350 entrées dans notre ensemble de données, et nous allons visualiser la distribution univariée le long de l’axe des abscisses.

Exemple de code :

import seaborn as sn
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

# read CSV file of dataset using pandas
dataset = pd.read_csv(r"C:\\Users\\DELL\\OneDrive\\Desktop\\samplecardataset.csv")
# kde plot using seaborn
sn.kdeplot(data=dataset, x="hp", shade=True, color="red")
plt.show()

Production :

Visualisation de tracé KDE avec pandas et seaborn - Tracé KDE avec Seaborn

Vous pouvez également inverser le tracé en visualisant la variable de données le long de l’axe y.

Exemple de code :

import seaborn as sn
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

# Read CSV file using pandas
dataset = pd.read_csv(r"C:\\Users\\DELL\\OneDrive\\Desktop\\samplecardataset.csv")
# KDE plotting using seaborn
sn.kdeplot(data=dataset, y="hp", shade=True, color="red")
plt.show()

Production :

Visualisation de tracé KDE avec pandas et seaborn - Tracé KDE avec Seaborn

Nous pouvons visualiser la distribution de probabilité de plusieurs valeurs cibles dans un seul graphique.

Exemple de code :

import seaborn as sn
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

# Read CSV file using pandas
dataset = pd.read_csv(r"C:\\Users\\DELL\\OneDrive\\Desktop\\samplecardataset.csv")
# KDE plotting using seaborn
sn.kdeplot(data=dataset, x="hp", shade=True, color="red")
sn.kdeplot(data=dataset, x="mpg", shade=True, color="green")
sn.kdeplot(data=dataset, x="disp", shade=True, color="blue")
plt.show()

Production :

Visualisation de tracé KDE avec pandas et seaborn - Tracé KDE avec Seaborn

Tracé KDE bidimensionnel ou bivarié utilisant Pandas et Seaborn en Python

Nous pouvons visualiser les données dans des tracés KDE bidimensionnels ou bivariés à l’aide de la bibliothèque seaborn et pandas.

De cette façon, nous pouvons visualiser la distribution de probabilité d’un échantillon donné par rapport à plusieurs attributs continus. Nous avons visualisé les données le long des axes x et y.

Exemple de code :

import seaborn as sn
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

# Read CSV file using pandas
dataset = pd.read_csv(r"C:\\Users\\DELL\\OneDrive\\Desktop\\samplecardataset.csv")
# KDE plotting using seaborn
sn.kdeplot(data=dataset, shade=True, x="hp", y="mpg")
plt.show()

Production :

Visualisation de tracé KDE avec pandas et seaborn - Tracé KDE avec Seaborn

De même, nous pouvons tracer la distribution de probabilité de plusieurs échantillons à l’aide d’un seul graphique KDE.

Exemple de code :

import seaborn as sn
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

# Read CSV file using pandas
dataset = pd.read_csv(r"C:\\Users\\DELL\\OneDrive\\Desktop\\samplecardataset.csv")
# KDE plotting using seaborn
sn.kdeplot(data=dataset, shade=True, x="hp", y="mpg", cmap="Blues")
sn.kdeplot(data=dataset, shade=True, x="hp", y="cyl", cmap="Greens")
plt.show()

Production :

Visualisation de tracé KDE avec pandas et seaborn - Tracé KDE avec Seaborn

Conclusion

Nous avons démontré dans ce didacticiel l’utilisation de la visualisation de tracé KDE à l’aide de la bibliothèque Pandas et Seaborn. Nous avons vu comment visualiser la distribution de probabilité d’échantillons simples et multiples dans un graphique KDE unidimensionnel.

Nous avons discuté de la façon d’utiliser le graphique KDE avec Seaborn et Pandas pour visualiser les données bidimensionnelles.

Article connexe - Pandas DataFrame