Pandas에서 DataFrame의 열 조각 가져 오기

Manav Narula 2023년1월30일
  1. Pandas DataFrame에서loc()을 사용하여 열 분할
  2. iloc()을 사용하여 Pandas DataFrame에서 열을 분할합니다
  3. redindex()를 사용하여 Pandas DataFrame에서 열을 분할합니다
Pandas에서 DataFrame의 열 조각 가져 오기

Pandas의 열 분할을 통해 데이터 프레임을 하위 집합으로 분할 할 수 있습니다. 즉, 필요한 열만있는 원본에서 새로운 Pandas 데이터 프레임을 생성합니다. 열 분할의 예로 다음 데이터 프레임을 사용합니다.

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.rand(4, 4), columns=["a", "b", "c", "d"])
print(df)

출력:

          a         b         c         d
0  0.797321  0.468894  0.335781  0.956516
1  0.546303  0.567301  0.955228  0.557812
2  0.385315  0.706735  0.058784  0.578468
3  0.751037  0.248284  0.172229  0.493763

Pandas DataFrame에서loc()을 사용하여 열 분할

Pandas 라이브러리는 열 분할을 수행하는 두 가지 이상의 방법을 제공합니다. 첫 번째는loc()함수를 사용하는 것입니다.

Pandas loc()함수를 사용하면 열 이름이나 인덱스 레이블을 사용하여 데이터 프레임의 요소에 액세스 할 수 있습니다. loc()을 사용한 열 분할 구문 :

dataframe.loc[:, [columns]]

예:

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.rand(4, 4), columns=["a", "b", "c", "d"])
df1 = df.loc[:, "a":"c"]  # Returns a new dataframe with columns a,b and c
print(df1)

출력:

          a         b         c
0  0.344952  0.611792  0.213331
1  0.907322  0.992097  0.080447
2  0.471611  0.625846  0.348778
3  0.656921  0.999646  0.976743

iloc()을 사용하여 Pandas DataFrame에서 열을 분할합니다

또한iloc()함수를 사용하여 행과 열의 정수 인덱스를 사용하여 데이터 프레임의 요소에 액세스 할 수 있습니다. iloc()을 사용한 열 분할 구문:

dataframe.iloc[:, [column - index]]

예:

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.rand(4, 4), columns=["a", "b", "c", "d"])
df1 = df.iloc[:, 0:2]  # Returns a new dataframe with first two columns
print(df1)

출력:

          a         b
0  0.034587  0.070249
1  0.648231  0.721517
2  0.485168  0.548045
3  0.377612  0.310408

redindex()를 사용하여 Pandas DataFrame에서 열을 분할합니다

reindex()함수는 데이터 프레임의 인덱스를 변경하는데도 사용할 수 있으며 열 분할에 사용할 수 있습니다. reindex()함수는 많은 인수를받을 수 있지만 열 분할의 경우 함수에 열 이름 만 제공하면됩니다.

reindex()를 사용한 열 분할 구문 :

dataframe.reindex(columns=[column_names])

예:

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.rand(4, 4), columns=["a", "b", "c", "d"])
# Returns a new dataframe with c and b columns
df1 = df.reindex(columns=["c", "b"])
print(df1)

출력:

          c         b
0  0.429790  0.962838
1  0.605381  0.463617
2  0.922489  0.733338
3  0.741352  0.118478
작가: Manav Narula
Manav Narula avatar Manav Narula avatar

Manav is a IT Professional who has a lot of experience as a core developer in many live projects. He is an avid learner who enjoys learning new things and sharing his findings whenever possible.

LinkedIn

관련 문장 - Pandas DataFrame