Pandas Dataframe에서 열을 인덱스로 설정

  1. set_index()를 사용하여 Pandas DataFrame의 인덱스로 열 만들기
  2. read_excel 또는read_csvindex_col 매개 변수를 사용하여 Pandas DataFrame의 색인으로 열 설정

일반적으로 Pandas Dataframe에는 기본적으로 인덱스로 0부터 객체 길이까지의 일련 번호가 있습니다. 또한 데이터 프레임의 특정 열을 인덱스로 만들 수도 있습니다. 이를 위해 pandas에서 제공하는set_index()를 사용할 수 있으며 Excel 또는 CSV 파일에서 데이터 프레임을 가져 오는 동안 열 인덱스를 지정할 수도 있습니다.

set_index()를 사용하여 Pandas DataFrame의 인덱스로 열 만들기

set_index()는 목록, 시리즈 또는 데이터 프레임에 적용하여 색인을 변경할 수 있습니다. Dataframe의 경우set_index()는 여러 열을 색인으로 만들 수도 있습니다.

예:

import pandas as pd
import numpy as np

colnames = ['Name','Time','Course']
df = pd.DataFrame([['Jay',10,'B.Tech'],
                   ['Raj',12,'BBA'],
                   ['Jack',11,'B.Sc']], columns = colnames)

print(df)

출력:

   Name  Time  Course
0   Jay    10  B.Tech
1   Raj    12     BBA
2  Jack    11    B.Sc

열을 인덱스로 만드는 구문 :

dataframe.set_index(Column_name,inplace = True)

set_index()를 사용하여 단일 열을 색인으로 만듭니다.

import pandas as pd
import numpy as np

colnames = ['Name','Time','Course']
df = pd.DataFrame([['Jay',10,'B.Tech'],
                   ['Raj',12,'BBA'],
                   ['Jack',11,'B.Sc']], columns = colnames)

df.set_index('Name', inplace = True)

print(df)

출력:

      Time  Course
Name              
Jay     10  B.Tech
Raj     12     BBA
Jack    11    B.Sc

여러 열을 색인으로 만듭니다.

import pandas as pd
import numpy as np

colnames = ['Name','Time','Course']
df = pd.DataFrame([['Jay',10,'B.Tech'],
                   ['Raj',12,'BBA'],
                   ['Jack',11,'B.Sc']], columns = colnames)

df.set_index(['Name','Course'], inplace = True)

print(df)

출력:

             Time
Name Course      
Jay  B.Tech    10
Raj  BBA       12
Jack B.Sc      11

read_excel 또는read_csvindex_col 매개 변수를 사용하여 Pandas DataFrame의 색인으로 열 설정

Excel 또는 CSV 파일에서 데이터 프레임을 읽는 동안 DataFrame의 인덱스로 원하는 열을 지정할 수 있습니다.

예:

import pandas as pd
import numpy as np
df = pd.read_excel("data.xlsx",index_col = 2)
print(df)

출력:

        Name  Time
Course            
B.Tech  Mark    12
BBA     Jack    10
B.Sc     Jay    11

관련 문장 - Pandas DataFrame

  • Pandas Dataframe 의 열에서 NaN 발생 횟수를 계산하는 방법
  • Pandas 복사 DataFrame