Pandas DataFrame의 모든 열 표시

Manav Narula 2023년1월30일
  1. 목록을 사용하여 Pandas DataFrame의 모든 열 표시
  2. NumPy 배열을 사용하여 Pandas DataFrame의 모든 열 표시
Pandas DataFrame의 모든 열 표시

실제 예에서는 수백, 수천 개의 행과 열이 포함 된 대규모 데이터 세트가 있습니다. 이러한 큰 데이터 청크에 대해 작업하려면 데이터의 행, 열 및 유형에 익숙해야합니다. 대부분의 경우 나중에 요소를 쉽게 추출하거나 다른 용도로 사용할 수 있도록 열 이름을 저장해야합니다.

일반적인 상황에서 우리는 일반적으로 dataframe.columns를 사용하여 DataFrame의 열 이름을 추출합니다. 이것은 작은 데이터 세트에서 작동 할 수 있지만 100 개가 넘는 열이있는 DataFrame을 처리하는 경우이 방법이 그다지 효율적이지 않음을 입증 할 수 있습니다.

다음 예는dataframe.columns의 문제를 보여줍니다.

import pandas as pd
import numpy as np

df = pd.DataFrame(columns=np.arange(150))

print(df.columns)
type(df.columns)

출력:

Int64Index([  0,   1,   2,   3,   4,   5,   6,   7,   8,   9,
            ...
            140, 141, 142, 143, 144, 145, 146, 147, 148, 149],
           dtype='int64', length=150)
pandas.core.indexes.numeric.Int64Index

위의 예에서는 0-149의 150 개 열이있는 빈 DataFrame을 생성하고 출력에서 ​​볼 수 있듯이 모든 열을 볼 수 없습니다. 처음 몇 개와 마지막 몇 개의 열 이름 만 볼 수 있으며 출력은 나중에 사용하기 위해 쉽게 저장하고 액세스 할 수있는 목록 또는시리즈가 아닙니다.

위의 문제에 대한 간단한 수정이 있습니다. dataframe.columns의 결과를 목록이나 NumPy 배열로 간단히 변환 할 수 있습니다.

목록을 사용하여 Pandas DataFrame의 모든 열 표시

이를 위해tolist()또는list()의 두 가지 메소드를 사용할 수 있습니다. 이 두 함수는 모두 열 이름을 목록으로 변환하고 동일한 출력을 제공합니다.

tolist()를 사용한 예:

import pandas as pd
import numpy as np

df = pd.DataFrame(columns=np.arange(150))

print(df.columns.tolist())
type(df.columns.tolist())

출력:

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149]
list

list()를 사용한 예 :

import pandas as pd
import numpy as np

df = pd.DataFrame(columns=np.arange(150))

print(list(df.columns))
type(list(df.columns))

출력:

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149]
list

NumPy 배열을 사용하여 Pandas DataFrame의 모든 열 표시

values()함수를 사용하여dataframe.columns의 결과를 NumPy 배열로 변환 할 수 있습니다.

예:

import pandas as pd
import numpy as np

df = pd.DataFrame(columns=np.arange(150))

print(df.columns.values)
type(df.columns.values)

출력:

[  0   1   2   3   4   5   6   7   8   9  10  11  12  13  14  15  16  17
  18  19  20  21  22  23  24  25  26  27  28  29  30  31  32  33  34  35
  36  37  38  39  40  41  42  43  44  45  46  47  48  49  50  51  52  53
  54  55  56  57  58  59  60  61  62  63  64  65  66  67  68  69  70  71
  72  73  74  75  76  77  78  79  80  81  82  83  84  85  86  87  88  89
  90  91  92  93  94  95  96  97  98  99 100 101 102 103 104 105 106 107
 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125
 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143
 144 145 146 147 148 149]
numpy.ndarray
작가: Manav Narula
Manav Narula avatar Manav Narula avatar

Manav is a IT Professional who has a lot of experience as a core developer in many live projects. He is an avid learner who enjoys learning new things and sharing his findings whenever possible.

LinkedIn

관련 문장 - Pandas DataFrame