Función Pandas DataFrame.resample()

Minahil Noor 30 enero 2023
  1. Sintaxis de pandas.DataFrame.resample():
  2. Códigos de ejemplo: Método DataFrame.resample() para volver a muestrear los datos Series semanalmente
  3. Códigos de ejemplo: Método DataFrame.resample() para volver a muestrear los datos Series mensualmente
Función Pandas DataFrame.resample()

La función Python Pandas DataFrame.resample() vuelve a muestrear los datos Series temporal.

Sintaxis de pandas.DataFrame.resample():

DataFrame.resample(
    rule,
    axis=0,
    closed=None,
    label=None,
    convention="start",
    kind=None,
    loffset=None,
    base=None,
    on=None,
    level=None,
    origin="start_day",
    offset=None,
)

Parámetros

rule Es la cadena de desplazamiento u objeto que representa la conversión de destino.
axis Especifica qué eje utilizar para el muestreo ascendente o descendente. Para Series, este valor predeterminado será 0, lo que significa a lo largo de las filas.
closed Especifica qué lado del intervalo de ubicación está cerrado. Tiene dos opciones: right o left.
label Especifica la etiqueta del borde del contenedor para etiquetar el cubo. Tiene dos opciones: right o left.
convention Tiene cuatro opciones: start, end, s o e. Solo para PeriodIndex, utiliza el start o el end de la regla.
kind Especifica el tipo de índice resultante. Tiene dos opciones: timestamp o period. La marca de tiempo convierte el índice resultante en un DateTimeIndex y el período lo convierte en un PeriodIndex.
loffset Ajusta las etiquetas de tiempo remuestreadas.
base Es un entero. Su valor predeterminado es 0.
on Representa el nombre de la columna que se utilizará en lugar del índice para el remuestreo. La columna debe ser similar a una fecha y hora.
level Representa el nombre del nivel que se utilizará para el remuestreo. El nivel debe ser similar a una fecha y hora.
origin Es la marca de tiempo en la que ajustar la agrupación. Tiene tres opciones: epoch, start o start_day.
offset Representa un desplazamiento timedelta añadido al parámetro origin.

Retorna

Devuelve el objeto remuestreado.

Códigos de ejemplo: Método DataFrame.resample() para volver a muestrear los datos Series semanalmente

import pandas as pd

index = pd.date_range('1/1/2021', periods=30, freq='D')
series = pd.Series(range(30), index=index)
print("The Original Series is: \n")
print(series)

series1= series.resample('W').sum()
print("The Resampled Data is: \n")
print(series1)

Producción:

The Original Series is: 

2021-01-01     0
2021-01-02     1
2021-01-03     2
2021-01-04     3
2021-01-05     4
2021-01-06     5
2021-01-07     6
2021-01-08     7
2021-01-09     8
2021-01-10     9
2021-01-11    10
2021-01-12    11
2021-01-13    12
2021-01-14    13
2021-01-15    14
2021-01-16    15
2021-01-17    16
2021-01-18    17
2021-01-19    18
2021-01-20    19
2021-01-21    20
2021-01-22    21
2021-01-23    22
2021-01-24    23
2021-01-25    24
2021-01-26    25
2021-01-27    26
2021-01-28    27
2021-01-29    28
2021-01-30    29
Freq: D, dtype: int64
The Resampled Data is: 

2021-01-03      3
2021-01-10     42
2021-01-17     91
2021-01-24    140
2021-01-31    159
Freq: W-SUN, dtype: int64

La función ha devuelto la suma muestreada semanalmente.

Códigos de ejemplo: Método DataFrame.resample() para volver a muestrear los datos Series mensualmente

import pandas as pd

index = pd.date_range('1/1/2021', periods=30, freq='D')
series = pd.Series(range(30), index=index)
print("The Original Series is: \n")
print(series)

series1= series.resample('M').sum()
print("The Resampled Data is: \n")
print(series1)

Producción:

The Original Series is: 

2021-01-01     0
2021-01-02     1
2021-01-03     2
2021-01-04     3
2021-01-05     4
2021-01-06     5
2021-01-07     6
2021-01-08     7
2021-01-09     8
2021-01-10     9
2021-01-11    10
2021-01-12    11
2021-01-13    12
2021-01-14    13
2021-01-15    14
2021-01-16    15
2021-01-17    16
2021-01-18    17
2021-01-19    18
2021-01-20    19
2021-01-21    20
2021-01-22    21
2021-01-23    22
2021-01-24    23
2021-01-25    24
2021-01-26    25
2021-01-27    26
2021-01-28    27
2021-01-29    28
2021-01-30    29
Freq: D, dtype: int64
The Resampled Data is: 

2021-01-31    435
Freq: M, dtype: int64

La función ha devuelto la suma muestreada mensualmente.

Artículo relacionado - Pandas DataFrame