Fonction Pandas DataFrame.resample()

Minahil Noor 30 janvier 2023
  1. Syntaxe de pandas.DataFrame.resample() :
  2. Exemples de codes : DataFrame.resample() Méthode pour rééchantillonner les données des séries sur une base hebdomadaire
  3. Exemples de codes : DataFrame.resample() Méthode pour rééchantillonner les données des séries sur une base mensuelle
Fonction Pandas DataFrame.resample()

La fonction Python Pandas DataFrame.resample() rééchantillonne les données de séries chronologiques.

Syntaxe de pandas.DataFrame.resample() :

DataFrame.resample(
    rule,
    axis=0,
    closed=None,
    label=None,
    convention="start",
    kind=None,
    loffset=None,
    base=None,
    on=None,
    level=None,
    origin="start_day",
    offset=None,
)

Paramètres

rule Il s’agit de la chaîne ou de l’objet de décalage représentant la conversion de la cible.
axis Il précise l’axe à utiliser pour l’échantillonnage ascendant ou descendant. Pour les séries, la valeur par défaut sera 0, c’est-à-dire le long des lignes.
closed Il précise quel côté de l’intervalle de la poubelle est fermé. Deux options s’offrent à vous : right ou left.
label Il précise l’étiquette du bord de la poubelle avec laquelle le seau doit être étiqueté. Deux possibilités s’offrent à vous : right ou left.
convention Il y a quatre options : start, end, s, ou, e. Pour le PeriodIndex uniquement, il utilise le start ou la end de la règle.
kind Il précise le type d’indice résultant. Deux options s’offrent à vous : timestamp ou period. L’horodatage convertit l’index résultant en un DateTimeIndex, et la période le convertit en un PeriodIndex.
loffset Il ajuste les étiquettes horaires rééchantillonnées.
base C’est un nombre entier. Sa valeur par défaut est 0.
on Il représente le nom de la colonne à utiliser à la place de l’index pour le rééchantillonnage. La colonne doit être de type date-heure.
level Il représente le nom du niveau à utiliser pour le rééchantillonnage. Le niveau doit être de type date-heure.
origin Il s’agit de l’horodatage sur lequel il faut ajuster le regroupement. Il existe trois options : epoch, start ou start_day.
offset Il représente un décalage timedelta ajouté au paramètre origin.

Retourne

Il renvoie l’objet rééchantillonné.

Exemples de codes : DataFrame.resample() Méthode pour rééchantillonner les données des séries sur une base hebdomadaire

import pandas as pd

index = pd.date_range('1/1/2021', periods=30, freq='D')
series = pd.Series(range(30), index=index)
print("The Original Series is: \n")
print(series)

series1= series.resample('W').sum()
print("The Resampled Data is: \n")
print(series1)

Production :

The Original Series is: 

2021-01-01     0
2021-01-02     1
2021-01-03     2
2021-01-04     3
2021-01-05     4
2021-01-06     5
2021-01-07     6
2021-01-08     7
2021-01-09     8
2021-01-10     9
2021-01-11    10
2021-01-12    11
2021-01-13    12
2021-01-14    13
2021-01-15    14
2021-01-16    15
2021-01-17    16
2021-01-18    17
2021-01-19    18
2021-01-20    19
2021-01-21    20
2021-01-22    21
2021-01-23    22
2021-01-24    23
2021-01-25    24
2021-01-26    25
2021-01-27    26
2021-01-28    27
2021-01-29    28
2021-01-30    29
Freq: D, dtype: int64
The Resampled Data is: 

2021-01-03      3
2021-01-10     42
2021-01-17     91
2021-01-24    140
2021-01-31    159
Freq: W-SUN, dtype: int64

La fonction a renvoyé la somme rééchantillonnée sur une base hebdomadaire.

Exemples de codes : DataFrame.resample() Méthode pour rééchantillonner les données des séries sur une base mensuelle

import pandas as pd

index = pd.date_range('1/1/2021', periods=30, freq='D')
series = pd.Series(range(30), index=index)
print("The Original Series is: \n")
print(series)

series1= series.resample('M').sum()
print("The Resampled Data is: \n")
print(series1)

Production :

The Original Series is: 

2021-01-01     0
2021-01-02     1
2021-01-03     2
2021-01-04     3
2021-01-05     4
2021-01-06     5
2021-01-07     6
2021-01-08     7
2021-01-09     8
2021-01-10     9
2021-01-11    10
2021-01-12    11
2021-01-13    12
2021-01-14    13
2021-01-15    14
2021-01-16    15
2021-01-17    16
2021-01-18    17
2021-01-19    18
2021-01-20    19
2021-01-21    20
2021-01-22    21
2021-01-23    22
2021-01-24    23
2021-01-25    24
2021-01-26    25
2021-01-27    26
2021-01-28    27
2021-01-29    28
2021-01-30    29
Freq: D, dtype: int64
The Resampled Data is: 

2021-01-31    435
Freq: M, dtype: int64

La fonction a renvoyé la somme rééchantillonnée sur une base mensuelle.

Article connexe - Pandas DataFrame