Как преобразовать индекс Pandas Dataframe в столбец

  1. df.index для добавления индекса в качестве нового столбца
  2. reset_index с rename_axis для переименования имени текущего столбца индекса
  3. метод set_index для преобразования столбца в индекс
  4. MultiIndex установить несколько слоев indexes на колонку

Мы введем различные методы преобразования index Панды DataFrame в столбец, такие как df.index, reset_index с осью rename_axis для переименования index и set_index.

Мы также представим, как мы можем применить Multi-Index к заданному DataFrame с несколькими слоями индексов.

df.index для добавления индекса в качестве нового столбца

Самый простой способ добавить индекс как столбец - это добавить df.index как новый столбец в DataFrame.

Рассмотрим следующий код:

# python 3.x
import pandas as pd
df = pd.DataFrame([
    (1,2,None),
    (None,4,None),
    (5,None,7),
    (5,None,None)
    ],columns=['a','b','d'])
df['index'] = df.index
print(df)

Вывод:

     a    b    d  index1
0  1.0  2.0  NaN       0
1  NaN  4.0  NaN       1
2  5.0  NaN  7.0       2
3  5.0  NaN  NaN       3

reset_index с rename_axis для переименования имени текущего столбца индекса

Мы можем изменить название нашего index, а затем использовать reset_index в серии:

# python 3.x
import pandas as pd

df = pd.DataFrame([
    (1,2,None),
    (None,4,None),
    (5,None,7),
    (5,None,None)], 
    columns=['a','b','d'])
df.df.rename_axis('index').reset_index()
print(df)

Выход:

   index    a    b    d
0      0  1.0  2.0  NaN
1      1  NaN  4.0  NaN
2      2  5.0  NaN  7.0
3      3  5.0  NaN  NaN

метод set_index для преобразования столбца в индекс

Мы можем преобразовать любую колонку в index методом set_index:

# python 3.x
import pandas as pd
df = pd.DataFrame([
    (1,2,None),
    (None,4,None),
    (5,4,7),
    (5,5,None)], 
    columns=['a','b','d'])
df.set_index('b',inplace=True)
print(df)

Вывод:

     a    d
b          
2  1.0  NaN
4  NaN  NaN
4  5.0  7.0
5  5.0  NaN

или если мы хотим удалить индексное имя, как в оригинале, мы можем сделать df.index.name = None:

# python 3.x
import pandas as pd
df = pd.DataFrame([
    (1,2,None),
    (None,4,None),
    (5,4,7),
    (5,5,None)
    ],columns=['a','b','d'])
df.set_index('b',inplace=True)
df.index.name = None
print(df)

Вывод:

     a    d
2  1.0  NaN
4  NaN  NaN
4  5.0  7.0
5  5.0  NaN

MultiIndex установить несколько слоев indexes на колонку

Мы можем использовать функцию MultiIndex.from_product() для создания MultiIndex следующим образом:

# python 3.x
import pandas as pd
import numpy as np
index = pd.MultiIndex.from_product([
    ['Burger', 'Steak', 'Sandwich'], 
    ['Half', 'Full']], 
    names=['Item', 'Type'])
df = pd.DataFrame(index=index, 
                  data=np.random.randint
                  (0, 10, (6,4)), 
                  columns=list('abcd'))
print(df)

Вывод:

               a  b  c  d
Item     Type            
Burger   Half  0  3  9  1
         Full  2  2  0  5
Steak    Half  8  4  5  5
         Full  5  8  0  7
Sandwich Half  2  8  9  5
         Full  4  4  5  9

Сопутствующая статья - Pandas DataFrame

  • Как получить заголовки столбцов Pandas DataFrame в виде списка
  • Как удалить колонку Pandas DataFrame
  • Как преобразовать столбец DataFrame в дату в Pandas
  • Как преобразовать плавающий диск в целое число в Pandas DataFrame
  • Как сортировать панды DataFrame по значениям одной колонки
  • Как получить совокупность Pandas по группам и Сумма
  • Как преобразовать словарь Python в Pandas DataFrame
  • Как добавить строку заголовка к Pandas DataFrame
  • Как преобразовать Pandas Dataframe в Numpy массив
  • Как подсчитать NaN-вступления в столбце в Pandas Dataframe
  • Как изменить порядок столбцов DataFrame
  • comments powered by Disqus