Alle Spalten eines Pandas DataFrame anzeigen

Manav Narula 10 August 2021
  1. Eine Liste verwenden, um alle Spalten eines Pandas DataFrame anzuzeigen
  2. Ein NumPy-Array verwenden, um alle Spalten eines Pandas DataFrame anzuzeigen
Alle Spalten eines Pandas DataFrame anzeigen

In realen Beispielen begegnen wir großen Datensätzen, die hunderte und tausende von Zeilen und Spalten enthalten. Um mit solch großen Datenmengen arbeiten zu können, müssen wir mit den Zeilen, Spalten und dem Typ der Daten vertraut sein. In vielen Fällen müssen wir auch die Namen der Spalten speichern, um später Elemente leichter extrahieren oder für andere Zwecke verwenden zu können.

In normalen Situationen verwenden wir normalerweise dataframe.columns, um die Namen der Spalten eines DataFrame zu extrahieren. Dies kann für kleine Datensätze funktionieren, aber wenn wir einen DataFrame mit mehr als hundert Spalten behandeln, kann sich diese Methode als nicht so effizient erweisen.

Das folgende Beispiel soll das Problem mit dataframe.columns veranschaulichen:

import pandas as pd
import numpy as np

df = pd.DataFrame(columns=np.arange(150))

print(df.columns)
type(df.columns)

Ausgabe:

Int64Index([  0,   1,   2,   3,   4,   5,   6,   7,   8,   9,
            ...
            140, 141, 142, 143, 144, 145, 146, 147, 148, 149],
           dtype='int64', length=150)
pandas.core.indexes.numeric.Int64Index

Im obigen Beispiel erzeugen wir einen leeren DataFrame mit 150 Spalten von 0-149, und wie in der Ausgabe zu sehen ist, sind wir nicht in der Lage, alle Spalten zu sehen. Wir können nur die ersten und letzten Spaltennamen sehen, und die Ausgabe ist keine Liste oder Series, die wir speichern und auf die wir zur weiteren Verwendung leicht zugreifen können.

Es gibt eine einfache Lösung für das obige Problem; wir können einfach das Ergebnis von dataframe.columns in eine Liste oder ein NumPy-Array konvertieren.

Eine Liste verwenden, um alle Spalten eines Pandas DataFrame anzuzeigen

Hierfür können wir zwei Methoden verwenden, tolist() oder list(). Beide Funktionen wandeln die Spaltennamen in eine Liste um und geben die gleiche Ausgabe.

Beispiel mit tolist():

import pandas as pd
import numpy as np

df = pd.DataFrame(columns=np.arange(150))

print(df.columns.tolist())
type(df.columns.tolist())

Ausgabe:

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149]
list

Beispiel mit list():

import pandas as pd
import numpy as np

df = pd.DataFrame(columns=np.arange(150))

print(list(df.columns))
type(list(df.columns))

Ausgabe:

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149]
list

Ein NumPy-Array verwenden, um alle Spalten eines Pandas DataFrame anzuzeigen

Wir können die Funktion values() verwenden, um das Ergebnis von dataframe.columns in ein NumPy-Array zu konvertieren.

Beispiel:

import pandas as pd
import numpy as np

df = pd.DataFrame(columns=np.arange(150))

print(df.columns.values)
type(df.columns.values)

Ausgabe:

[  0   1   2   3   4   5   6   7   8   9  10  11  12  13  14  15  16  17
  18  19  20  21  22  23  24  25  26  27  28  29  30  31  32  33  34  35
  36  37  38  39  40  41  42  43  44  45  46  47  48  49  50  51  52  53
  54  55  56  57  58  59  60  61  62  63  64  65  66  67  68  69  70  71
  72  73  74  75  76  77  78  79  80  81  82  83  84  85  86  87  88  89
  90  91  92  93  94  95  96  97  98  99 100 101 102 103 104 105 106 107
 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125
 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143
 144 145 146 147 148 149]
numpy.ndarray
Manav Narula avatar Manav Narula avatar

Manav is a IT Professional who has a lot of experience as a core developer in many live projects. He is an avid learner who enjoys learning new things and sharing his findings whenever possible.

LinkedIn

Verwandter Artikel - Pandas DataFrame