Spalten als Index in Pandas Dataframe setzen

Manav Narula 26 Dezember 2020
  1. Verwendung von set_index(), um eine Spalte als Index in einem Pandas DataFrame festzulegen
  2. Verwendung des Parameters index_col in read_excel oder read_csv, um eine Spalte als Index in Pandas DataFrame zu setzen
Spalten als Index in Pandas Dataframe setzen

Normalerweise haben wir in einem Pandas DataFrame standardmäßig fortlaufende Nummern von 0 bis zur Länge des Objekts als Index. Wir können auch eine bestimmte Spalte eines Dataframes als seinen Index festlegen. Dazu können wir die in Pandas bereitgestellte Funktion set_index() verwenden, und wir können den Spaltenindex auch beim Importieren eines Dataframes aus einer Excel- oder CSV-Datei angeben.

Verwendung von set_index(), um eine Spalte als Index in einem Pandas DataFrame festzulegen

set_index() kann auf Listen, Serien oder Dataframes angewendet werden, um deren Index zu ändern. Bei Dataframes kann set_index() auch mehrere Spalten als deren Index festlegen.

Beispiel:

import pandas as pd
import numpy as np

colnames = ['Name','Time','Course']
df = pd.DataFrame([['Jay',10,'B.Tech'],
                   ['Raj',12,'BBA'],
                   ['Jack',11,'B.Sc']], columns = colnames)

print(df)

Ausgabe:

   Name  Time  Course
0   Jay    10  B.Tech
1   Raj    12     BBA
2  Jack    11    B.Sc

Die Syntax, um Spalten als Index zu machen:

dataframe.set_index(Column_name,inplace = True)

Eine einzelne Spalte mit set_index() als Index machen:

import pandas as pd
import numpy as np

colnames = ['Name','Time','Course']
df = pd.DataFrame([['Jay',10,'B.Tech'],
                   ['Raj',12,'BBA'],
                   ['Jack',11,'B.Sc']], columns = colnames)

df.set_index('Name', inplace = True)

print(df)

Ausgabe:

      Time  Course
Name              
Jay     10  B.Tech
Raj     12     BBA
Jack    11    B.Sc

Mehrere Spalten als Index machen:

import pandas as pd
import numpy as np

colnames = ['Name','Time','Course']
df = pd.DataFrame([['Jay',10,'B.Tech'],
                   ['Raj',12,'BBA'],
                   ['Jack',11,'B.Sc']], columns = colnames)

df.set_index(['Name','Course'], inplace = True)

print(df)

Ausgabe:

             Time
Name Course      
Jay  B.Tech    10
Raj  BBA       12
Jack B.Sc      11

Verwendung des Parameters index_col in read_excel oder read_csv, um eine Spalte als Index in Pandas DataFrame zu setzen

Beim Lesen eines DataFrames aus einer Excel- oder CSV-Datei können wir die Spalte angeben, die wir als Index des DataFrames haben wollen.

Beispiel:

import pandas as pd
import numpy as np
df = pd.read_excel("data.xlsx",index_col = 2)
print(df)

Ausgabe:

        Name  Time
Course            
B.Tech  Mark    12
BBA     Jack    10
B.Sc     Jay    11
Author: Manav Narula
Manav Narula avatar Manav Narula avatar

Manav is a IT Professional who has a lot of experience as a core developer in many live projects. He is an avid learner who enjoys learning new things and sharing his findings whenever possible.

LinkedIn

Verwandter Artikel - Pandas DataFrame