Função Pandas DataFrame.resample()

Minahil Noor 30 janeiro 2023
  1. Sintaxe de pandas.DataFrame.resample():
  2. Códigos de exemplo: Método DataFrame.resample() para reamostrar os dados da série semanalmente
  3. Códigos de exemplo: Método DataFrame.resample() para reamostrar os dados da série com base mensal
Função Pandas DataFrame.resample()

A função Python Pandas DataFrame.resample() faz uma nova amostra dos dados da série temporal.

Sintaxe de pandas.DataFrame.resample():

DataFrame.resample(
    rule,
    axis=0,
    closed=None,
    label=None,
    convention="start",
    kind=None,
    loffset=None,
    base=None,
    on=None,
    level=None,
    origin="start_day",
    offset=None,
)

Parâmetros

rule É a string de deslocamento ou objeto que representa a conversão de destino.
axis Ele especifica qual eixo usar para aumentar ou diminuir a amostragem. Para Series, o padrão é 0, o que significa ao longo das linhas.
closed Ele especifica qual lado do intervalo bin está fechado. Tem duas opções: right ou left.
label Ele especifica o rótulo da borda da caixa para rotular o balde. Tem duas opções: right ou left.
convention Possui quatro opções: start, end, s, ou e. Apenas para PeriodIndex, ele usa o start ou end da regra.
kind Ele especifica o tipo de índice resultante. Possui duas opções: timestamp ou period. Timestamp converte o índice resultante em DateTimeIndex e period o converte em PeriodIndex.
loffset Ele ajusta os rótulos de tempo reamostrados.
base É um número inteiro. Seu valor padrão é 0.
on Ele representa o nome da coluna a ser usada em vez do índice para reamostragem. A coluna deve ser semelhante a data e hora.
level Ele representa o nome do nível a ser usado para reamostragem. O nível deve ser semelhante a data e hora.
origin É o carimbo de data/hora para ajustar o agrupamento. Tem três opções: epoch, start ou start_day.
offset Ele representa um deslocamento timedelta adicionado ao parâmetro origin.

Retornar

Ele retorna o objeto reamostrado.

Códigos de exemplo: Método DataFrame.resample() para reamostrar os dados da série semanalmente

import pandas as pd

index = pd.date_range('1/1/2021', periods=30, freq='D')
series = pd.Series(range(30), index=index)
print("The Original Series is: \n")
print(series)

series1= series.resample('W').sum()
print("The Resampled Data is: \n")
print(series1)

Resultado:

The Original Series is: 

2021-01-01     0
2021-01-02     1
2021-01-03     2
2021-01-04     3
2021-01-05     4
2021-01-06     5
2021-01-07     6
2021-01-08     7
2021-01-09     8
2021-01-10     9
2021-01-11    10
2021-01-12    11
2021-01-13    12
2021-01-14    13
2021-01-15    14
2021-01-16    15
2021-01-17    16
2021-01-18    17
2021-01-19    18
2021-01-20    19
2021-01-21    20
2021-01-22    21
2021-01-23    22
2021-01-24    23
2021-01-25    24
2021-01-26    25
2021-01-27    26
2021-01-28    27
2021-01-29    28
2021-01-30    29
Freq: D, dtype: int64
The Resampled Data is: 

2021-01-03      3
2021-01-10     42
2021-01-17     91
2021-01-24    140
2021-01-31    159
Freq: W-SUN, dtype: int64

A função retornou a soma reamostrada semanalmente.

Códigos de exemplo: Método DataFrame.resample() para reamostrar os dados da série com base mensal

import pandas as pd

index = pd.date_range('1/1/2021', periods=30, freq='D')
series = pd.Series(range(30), index=index)
print("The Original Series is: \n")
print(series)

series1= series.resample('M').sum()
print("The Resampled Data is: \n")
print(series1)

Resultado:

The Original Series is: 

2021-01-01     0
2021-01-02     1
2021-01-03     2
2021-01-04     3
2021-01-05     4
2021-01-06     5
2021-01-07     6
2021-01-08     7
2021-01-09     8
2021-01-10     9
2021-01-11    10
2021-01-12    11
2021-01-13    12
2021-01-14    13
2021-01-15    14
2021-01-16    15
2021-01-17    16
2021-01-18    17
2021-01-19    18
2021-01-20    19
2021-01-21    20
2021-01-22    21
2021-01-23    22
2021-01-24    23
2021-01-25    24
2021-01-26    25
2021-01-27    26
2021-01-28    27
2021-01-29    28
2021-01-30    29
Freq: D, dtype: int64
The Resampled Data is: 

2021-01-31    435
Freq: M, dtype: int64

A função retornou a soma reamostrada mensalmente.

Artigo relacionado - Pandas DataFrame