Cómo extraer mes y año por separado de la columna Fecha y hora en Pandas
-
pandas.Series.dt.year()ypandas.Series.dt.month()métodos para extraer mes y año -
Método
strftime()para extraer año y mes -
pandas.DatetimeIndex.monthypandas.DatetimeIndex.yearpara extraer año y mes
Podríamos extraer año y mes de la columna Datetime usando los métodos pandas.Series.dt.year() y pandas.Series.dt.month() respectivamente. Si los datos no están en el tipo Datey hora, primero debemos convertirlos en Datey hora. También podemos extraer el año y el mes usando pandas.DatetimeIndex.month junto con el método pandas.DatetimeIndex.year y strftime().
pandas.Series.dt.year() y pandas.Series.dt.month() métodos para extraer mes y año
Los métodos pandas.Series.dt.year() y pandas.Series.dt.month() aplicados al tipo Datetime devuelven el array NumPy del año y el mes respectivamente de la entrada Datetime en el objeto Series.
import pandas as pd
import numpy as np
import datetime
list_of_dates = ["2019-11-20", "2020-01-02", "2020-02-05", "2020-03-10", "2020-04-16"]
employees = ["Hisila", "Shristi", "Zeppy", "Alina", "Jerry"]
df = pd.DataFrame({"Joined date": pd.to_datetime(list_of_dates)}, index=employees)
df["Year"] = df["Joined date"].dt.year
df["Month"] = df["Joined date"].dt.month
print(df)
Producción :
Joined date Year Month
Hisila 2019-11-20 2019 11
Shristi 2020-01-02 2020 1
Zeppy 2020-02-05 2020 2
Alina 2020-03-10 2020 3
Jerry 2020-04-16 2020 4
Sin embargo, si la columna no es del tipo Datey hora, primero debemos convertir la columna al tipo Datey hora utilizando el método to_datetime().
import pandas as pd
import numpy as np
import datetime
list_of_dates = ["11/20/2019", "01/02/2020", "02/05/2020", "03/10/2020", "04/16/2020"]
employees = ["Hisila", "Shristi", "Zeppy", "Alina", "Jerry"]
df = pd.DataFrame({"Joined date": pd.to_datetime(list_of_dates)}, index=employees)
df["Joined date"] = pd.to_datetime(df["Joined date"])
df["Year"] = df["Joined date"].dt.year
df["Month"] = df["Joined date"].dt.month
print(df)
Producción :
Joined date Year Month
Hisila 2019-11-20 2019 11
Shristi 2020-01-02 2020 1
Zeppy 2020-02-05 2020 2
Alina 2020-03-10 2020 3
Jerry 2020-04-16 2020 4
Método strftime() para extraer año y mes
El método strftime() toma Datetime toma códigos de formato como entrada y devuelve una cadena que representa el formato específico especificado en la salida. Utilizamos %Y y %m como códigos de formato para extraer año y mes.
import pandas as pd
import numpy as np
import datetime
list_of_dates = ["2019-11-20", "2020-01-02", "2020-02-05", "2020-03-10", "2020-04-16"]
employees = ["Hisila", "Shristi", "Zeppy", "Alina", "Jerry"]
df = pd.DataFrame({"Joined date": pd.to_datetime(list_of_dates)}, index=employees)
df["year"] = df["Joined date"].dt.strftime("%Y")
df["month"] = df["Joined date"].dt.strftime("%m")
print(df)
Producción :
Joined date year month
Hisila 2019-11-20 2019 11
Shristi 2020-01-02 2020 01
Zeppy 2020-02-05 2020 02
Alina 2020-03-10 2020 03
Jerry 2020-04-16 2020 04
pandas.DatetimeIndex.month y pandas.DatetimeIndex.year para extraer año y mes
Otro enfoque simple para extraer el mes y el año de la columna Datey hora es recuperar los valores de los atributos de año y mes de los objetos de pandas.DatetimeIndex clase.
import pandas as pd
import numpy as np
import datetime
list_of_dates = ["2019-11-20", "2020-01-02", "2020-02-05", "2020-03-10", "2020-04-16"]
employees = ["Hisila", "Shristi", "Zeppy", "Alina", "Jerry"]
df = pd.DataFrame({"Joined date": pd.to_datetime(list_of_dates)}, index=employees)
df["year"] = pd.DatetimeIndex(df["Joined date"]).year
df["month"] = pd.DatetimeIndex(df["Joined date"]).month
print(df)
Producción :
Joined date Year Month
Hisila 2019-11-20 2019 11
Shristi 2020-01-02 2020 1
Zeppy 2020-02-05 2020 2
Alina 2020-03-10 2020 3
Jerry 2020-04-16 2020 4
La clase pandas.DatetimeIndex es un ndarray inmutable de datos datetime64. Tiene atributos como year, month, day, etc.
Suraj Joshi is a backend software engineer at Matrice.ai.
LinkedIn