Pandas の日時列から月と年を別々に抽出する方法

  1. pandas.Series.dt.year() および pandas.Series.month() と年を抽出する dt.month() メソッド
  2. 年と月を抽出する strftime() メソッド
  3. 年と月を抽出するための pandas.DatetimeIndex.monthpandas.DatetimeIndex.year

pandas.Series.dt.year() メソッドと pandas.Series.dt.month() メソッドをそれぞれ使用して、Datetime 列から年と月を抽出できます。データが Datetime 型でない場合は、最初に Datetime に変換する必要があります。pandas.DatetimeIndex.yearstrftime() メソッドとともに、pandas.DatetimeIndex.month を使用して年と月を抽出することもできます。

pandas.Series.dt.year() および pandas.Series.month() と年を抽出する dt.month() メソッド

Datetime タイプに適用された pandas.Series.dt.year() メソッドと pandas.Series.dt.month() メソッドは、シリーズオブジェクトの Datetime エントリの年と月の numpy 配列をそれぞれ返します。

import pandas as pd
import numpy as np
import datetime

list_of_dates = ['2019-11-20', '2020-01-02', '2020-02-05','2020-03-10','2020-04-16']
employees=['Hisila', 'Shristi','Zeppy','Alina','Jerry']
df = pd.DataFrame({'Joined date': pd.to_datetime(list_of_dates)},index=employees)

df['Year'] = df['Joined date'].dt.year 
df['Month'] = df['Joined date'].dt.month 
print(df)

出力:

        Joined date  Year  Month
Hisila   2019-11-20  2019     11
Shristi  2020-01-02  2020      1
Zeppy    2020-02-05  2020      2
Alina    2020-03-10  2020      3
Jerry    2020-04-16  2020      4

ただし、列が Datetime 型でない場合は、最初に to_datetime() メソッドを使用して列を Datetime 型に変換する必要があります。

import pandas as pd
import numpy as np
import datetime

list_of_dates = ['11/20/2019', '01/02/2020', '02/05/2020','03/10/2020','04/16/2020']
employees=['Hisila', 'Shristi','Zeppy','Alina','Jerry']
df = pd.DataFrame({'Joined date': pd.to_datetime(list_of_dates)},index=employees)
df['Joined date']= pd.to_datetime(df['Joined date']) 

df['Year'] = df['Joined date'].dt.year 
df['Month'] = df['Joined date'].dt.month 
print(df)

出力:

        Joined date  Year  Month
Hisila   2019-11-20  2019     11
Shristi  2020-01-02  2020      1
Zeppy    2020-02-05  2020      2
Alina    2020-03-10  2020      3
Jerry    2020-04-16  2020      4

年と月を抽出する strftime() メソッド

strftime() メソッドは、Datetime を入力として受け取り、出力で指定された特定の形式を表す文字列を返します。年と月を抽出するためのフォーマットコードとして、%Y%m を使用します。

import pandas as pd
import numpy as np
import datetime

list_of_dates = ['2019-11-20', '2020-01-02', '2020-02-05','2020-03-10','2020-04-16']
employees=['Hisila', 'Shristi','Zeppy','Alina','Jerry']
df = pd.DataFrame({'Joined date': pd.to_datetime(list_of_dates)},index=employees)

df['year'] = df['Joined date'].dt.strftime('%Y')
df['month'] = df['Joined date'].dt.strftime('%m')

print(df)

出力:

        Joined date  year month
Hisila   2019-11-20  2019    11
Shristi  2020-01-02  2020    01
Zeppy    2020-02-05  2020    02
Alina    2020-03-10  2020    03
Jerry    2020-04-16  2020    04

年と月を抽出するための pandas.DatetimeIndex.monthpandas.DatetimeIndex.year

Datetime 列から月と年を抽出するもう 1つの簡単な方法は、pandas.DatetimeIndex クラスのオブジェクトの年と月の属性の値を取得することです。

import pandas as pd
import numpy as np
import datetime

list_of_dates = ['2019-11-20', '2020-01-02', '2020-02-05','2020-03-10','2020-04-16']
employees=['Hisila', 'Shristi','Zeppy','Alina','Jerry']
df = pd.DataFrame({'Joined date': pd.to_datetime(list_of_dates)},index=employees)

df['year'] = pd.DatetimeIndex(df['Joined date']).year
df['month'] = pd.DatetimeIndex(df['Joined date']).month

print(df)

出力:

        Joined date  Year  Month
Hisila   2019-11-20  2019     11
Shristi  2020-01-02  2020      1
Zeppy    2020-02-05  2020      2
Alina    2020-03-10  2020      3
Jerry    2020-04-16  2020      4

pandas.DatetimeIndex クラスは、datetime64 データの不変の ndarray です。yearmonthday などの属性があります。

comments powered by Disqus