如何将 Pandas DataFrame 的索引转换为列

Asad Riaz 2023年1月30日
  1. df.index 将索引添加为新列
  2. 使用带有 rename axisreset_index 重命名当前索引列名
  3. set_index 方法将列转换为索引
  4. MultiIndex 可在 column 上设置 indexs 的多层索引
如何将 Pandas DataFrame 的索引转换为列

我们将介绍将 Pandas DataFrame 的索引转换为列的各种方法,例如 df.index,带有 rename_axisreset_index 来重命名索引,以及 set_index

我们还将介绍如何将多索引应用于具有多层索引的给定 DataFrame

df.index 将索引添加为新列

将索引添加为列的最简单方法是将 df.index 作为新列添加到 DataFrame

考虑以下代码:

# python 3.x
import pandas as pd

df = pd.DataFrame(
    [(1, 2, None), (None, 4, None), (5, None, 7), (5, None, None)],
    columns=["a", "b", "d"],
)
df["index"] = df.index
print(df)

输出:

     a    b    d  index1
0  1.0  2.0  NaN       0
1  NaN  4.0  NaN       1
2  5.0  NaN  7.0       2
3  5.0  NaN  NaN       3

使用带有 rename axisreset_index 重命名当前索引列名

我们可以更改索引的名称,然后将 reset_index 更改为一系列:

# python 3.x
import pandas as pd

df = pd.DataFrame(
    [(1, 2, None), (None, 4, None), (5, None, 7), (5, None, None)],
    columns=["a", "b", "d"],
)
df = df.rename_axis("index").reset_index()
print(df)

输出:

   index    a    b    d
0      0  1.0  2.0  NaN
1      1  NaN  4.0  NaN
2      2  5.0  NaN  7.0
3      3  5.0  NaN  NaN

set_index 方法将列转换为索引

我们可以使用 set_index 方法将任何列转换为 index:

# python 3.x
import pandas as pd

df = pd.DataFrame(
    [(1, 2, None), (None, 4, None), (5, 4, 7), (5, 5, None)], columns=["a", "b", "d"]
)
df.set_index("b", inplace=True)
print(df)

输出:

     a    d
b          
2  1.0  NaN
4  NaN  NaN
4  5.0  7.0
5  5.0  NaN

或者,如果我们要删除索引名,如原始文件中那样,则可以执行 df.index.name = None

# python 3.x
import pandas as pd

df = pd.DataFrame(
    [(1, 2, None), (None, 4, None), (5, 4, 7), (5, 5, None)], columns=["a", "b", "d"]
)
df.set_index("b", inplace=True)
df.index.name = None
print(df)

输出:

     a    d
2  1.0  NaN
4  NaN  NaN
4  5.0  7.0
5  5.0  NaN

MultiIndex 可在 column 上设置 indexs 的多层索引

我们可以使用 MultiIndex.from_product() 函数创建一个 MultiIndex,如下所示:

# python 3.x
import pandas as pd
import numpy as np

index = pd.MultiIndex.from_product(
    [["Burger", "Steak", "Sandwich"], ["Half", "Full"]], names=["Item", "Type"]
)
df = pd.DataFrame(
    index=index, data=np.random.randint(0, 10, (6, 4)), columns=list("abcd")
)
print(df)

输出:

               a  b  c  d
Item     Type            
Burger   Half  0  3  9  1
         Full  2  2  0  5
Steak    Half  8  4  5  5
         Full  5  8  0  7
Sandwich Half  2  8  9  5
         Full  4  4  5  9

相关文章 - Pandas DataFrame