Pairplot Seaborn en Python

Manav Narula 16 juillet 2021
Pairplot Seaborn en Python

En Python, nous utilisons le module seaborn pour créer différents types de graphiques et de tracés afin de visualiser un ensemble de données. Différentes fonctions créent différents types de tracés. Parfois, un seul graphique peut ne pas suffire pour visualiser un ensemble de données, et nous pouvons avoir besoin de tracer plusieurs graphiques simultanément. La fonction pairplot() peut vous aider.

Ce tutoriel présentera comment utiliser la fonction pairplot() du module seaborn en Python.

Il est basé sur la classe PairGrid de seaborn et renvoie un objet de son type. Il trace également toutes les colonnes numériques des données sur les deux axes, affichant une matrice de différents tracés. Il produit une figure finale avec un graphique uniforme sur la diagonale et un tracé différent sur les triangles supérieur et inférieur.

Si nous le souhaitons, nous pouvons spécifier les variables requises à tracer à l’aide de l’argument x_vars, y_vars ou vars dans la fonction pairplot().

Par example,

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns


df = pd.DataFrame(
    {
        "Quantity": [5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8],
        "Price": [9, 10, 15, 16, 13, 14, 15, 18, 11, 12, 14, 15, 16, 17, 18, 19],
        "Day": [1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2],
        "Product": [
            "A",
            "A",
            "A",
            "A",
            "B",
            "B",
            "B",
            "B",
            "A",
            "A",
            "A",
            "A",
            "B",
            "B",
            "B",
            "B",
        ],
    }
)
sns.pairplot(df)

pairplot à seaborn

Dans le code ci-dessus, nous créons un exemple simple de la fonction pairplot(). Remarquez les différents graphiques tracés sur la diagonale.

Nous pouvons modifier le résultat final en utilisant quelques méthodes et paramètres. Le paramètre hue peut être utilisé pour tracer les différentes catégories dans différentes couleurs. L’argument palette permet de définir les couleurs utilisées pour cela. Une légende commune est ajoutée pour tous les graphiques. Nous pouvons ajouter ceci dans l’exemple ci-dessus pour distinguer les deux produits.

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

df = pd.DataFrame(
    {
        "Quantity": [5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8],
        "Price": [9, 10, 15, 16, 13, 14, 15, 18, 11, 12, 14, 15, 16, 17, 18, 19],
        "Day": [1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2],
        "Product": [
            "A",
            "A",
            "A",
            "A",
            "B",
            "B",
            "B",
            "B",
            "A",
            "A",
            "A",
            "A",
            "B",
            "B",
            "B",
            "B",
        ],
    }
)
sns.pairplot(df, hue="Product", palette="husl")

pairplot dans seaborn avec le paramètre hue

Nous pouvons également contrôler le type de graphiques à tracer sur le haut-bas ou les triangles et la diagonale. Le paramètre diag_kind permet de spécifier les tracés pour la diagonale et le paramètre kind pour le reste. Leur valeur peut être reg, scatter, kde, hist ou un autre tracé.

Par example,

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns


df = pd.DataFrame(
    {
        "Quantity": [5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8],
        "Price": [9, 10, 15, 16, 13, 14, 15, 18, 11, 12, 14, 15, 16, 17, 18, 19],
        "Day": [1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2],
        "Product": [
            "A",
            "A",
            "A",
            "A",
            "B",
            "B",
            "B",
            "B",
            "A",
            "A",
            "A",
            "A",
            "B",
            "B",
            "B",
            "B",
        ],
    }
)
sns.pairplot(df, hue="Product", diag_kind="hist", kind="scatter")

pairplot dans seaborn avec le paramètre diag_kind

Pour personnaliser les tracés individuels sur la diagonale et autrement, nous utilisons les paramètres plot_kws et diag_kws. Nous transmettons les personnalisations requises sous forme de paires clé-valeur de dictionnaire. Nous pouvons également modifier la hauteur des parcelles individuelles en utilisant le paramètre height.

De plus, n’oubliez pas qu’il renvoie un objet de la classe PairGrid pour personnaliser la figure finale en utilisant les méthodes de cette classe.

Auteur: Manav Narula
Manav Narula avatar Manav Narula avatar

Manav is a IT Professional who has a lot of experience as a core developer in many live projects. He is an avid learner who enjoys learning new things and sharing his findings whenever possible.

LinkedIn