Fonction Pandas DataFrame.corr()

Minahil Noor 30 janvier 2023
  1. Syntaxe de la fonction pandas.DataFrame.corr() :
  2. Exemples de codes : DataFrame.corr() Méthode pour trouver la matrice de corrélation en utilisant la méthode de Pearson
  3. Exemples de codes : DataFrame.corr() Méthode pour trouver la matrice de corrélation en utilisant la méthode kendall
  4. Exemples de codes : DataFrame.corr()Méthode pour trouver la matrice de corrélation en utilisant la méthode spearman avec plus de paires de valeurs de colonnes
Fonction Pandas DataFrame.corr()

La fonction Python Pandas DataFrame.corr() trouve la corrélation entre les colonnes du DataFrame.

Syntaxe de la fonction pandas.DataFrame.corr() :

DataFrame.corr(method="pearson", min_periods=1)

Paramètres

method C’est la méthode de corrélation. Elle peut être pearson, kendall et spearman. Par défaut, c’est pearson.
min_periods Ce paramètre spécifie le nombre minimum d’observations requises par paire de colonnes pour obtenir un résultat valable. Il n’est actuellement disponible que pour les corrélations pearson et spearman.

Retourne

Il renvoie la Dataframe avec la corrélation calculée entre les colonnes.

Exemples de codes : DataFrame.corr() Méthode pour trouver la matrice de corrélation en utilisant la méthode de Pearson

import pandas as pd

dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
                        'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
                        'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)

dataframe1 = dataframe.corr()
print("The Correlation Matrix is: \n")
print(dataframe1)

Production :

The Original Data frame is: 

   Attendance    Name  Obtained Marks
0          60  Olivia              90
1         100    John              75
2          80   Laura              82
3          78     Ben              64
4          95   Kevin              45
The Correlation Matrix is: 

                Attendance  Obtained Marks
Attendance         1.00000        -0.61515
Obtained Marks    -0.61515         1.00000

La fonction a renvoyé la matrice de corrélation. Elle a ignoré la colonne non numérique. Elle a calculé la corrélation en utilisant la méthode Pearson et une paire de valeurs de colonnes (min_position= 1).

Exemples de codes : DataFrame.corr() Méthode pour trouver la matrice de corrélation en utilisant la méthode kendall

Pour trouver la corrélation en utilisant la méthode Kendall, nous appellerons la fonction corr() pour utiliser method="kendall".

import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
                        'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
                        'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)

dataframe1 = dataframe.corr(method= "kendall")
print("The Correlation Matrix is: \n")
print(dataframe1)

Production :

The Original Data frame is: 

   Attendance    Name  Obtained Marks
0          60  Olivia              90
1         100    John              75
2          80   Laura              82
3          78     Ben              64
4          95   Kevin              45
The Correlation Matrix is: 

                Attendance  Obtained Marks
Attendance             1.0            -0.4
Obtained Marks        -0.4             1.0

La fonction a renvoyé la matrice de corrélation. Elle a calculé la corrélation en utilisant la méthode de Kendall et une paire de valeurs de colonnes (min_position= 1).

Exemples de codes : DataFrame.corr()Méthode pour trouver la matrice de corrélation en utilisant la méthode spearman avec plus de paires de valeurs de colonnes

Maintenant, nous allons fixer la valeur de min_periods à 2 en utilisant la méthode spearman. Le paramètre min_periods n’est disponible que pour les méthodes pearson et spearman.

import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
                        'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
                        'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)

dataframe1 = dataframe.corr(method= "spearman", min_periods = 2)
print("The Correlation Matrix is: \n")
print(dataframe1)

Production :

The Original Data frame is: 

   Attendance    Name  Obtained Marks
0          60  Olivia              90
1         100    John              75
2          80   Laura              82
3          78     Ben              64
4          95   Kevin              45
The Correlation Matrix is: 

                Attendance  Obtained Marks
Attendance             1.0            -0.5
Obtained Marks        -0.5             1.0

La fonction a maintenant calculé la corrélation en utilisant 2 paires de valeurs de colonnes.

Article connexe - Pandas DataFrame