如何在 Pandas DataFrame 中重命名列

Puneet Dobhal 2023年1月30日
  1. 使用 DataFrame.columns 方法重命名 Pandas DataFrame 中的列
  2. 使用 DataFrame.rename() 方法重命名 Pandas DataFrame 中的列
  3. 使用 DataFrame.set_axis() 方法重命名 Pandas DataFrame 中的列
如何在 Pandas DataFrame 中重命名列

通常,我们需要在数据分析中操作列名。在本文中,我们将探索不同的方法来为已定义的 panadas DataFrame 操纵/重命名列名。

使用 DataFrame.columns 方法重命名 Pandas DataFrame 中的列

此方法非常简单,可让你直接重命名列。我们可以使用 DataFrame.columns 属性分配一个新的列名列表,如下所示:

import pandas as pd

example_df = pd.DataFrame(
    [["John", 20, 45], ["Peter", 21, 62], ["Scot", 25, 68]],
    index=[0, 1, 2],
    columns=["Name", "Age", "Marks"],
)

print "\nOriginal DataFrame"
print (pd.DataFrame(example_df))
example_df.columns = ["Name", "Age", "Roll_no"]

print "\nModified DataFrame"
print (pd.DataFrame(example_df))

输出:

Original DataFrame
    Name  Age  Marks
0   John   20     45
1  Peter   21     62
2   Scot   25     68

Modified DataFrame
    Name  Age  Roll_no
0   John   20       45
1  Peter   21       62
2   Scot   25       68

这种方法的一个缺点是,即使只需要重命名一列,也必须列出整个列。当你有大量列时,指定整个列列表将变得不切实际。

使用 DataFrame.rename() 方法重命名 Pandas DataFrame 中的列

前一种方法的替代方法是使用 DataFrame.rename() 方法。当我们不需要重命名所有列时,此方法非常方便。

我们需要将旧列名称指定为键,将新名称指定为值。

import pandas as pd

example_df = pd.DataFrame(
    [["John", 20, 45, 78], ["Peter", 21, 62, 68], ["Scot", 25, 68, 95]],
    index=[0, 1, 2],
    columns=["Name", "Age", "Marks", "Roll_no"],
)

print "\nOriginal DataFrame"
print (pd.DataFrame(example_df))
example_df.rename(columns={"Marks": "Roll_no", "Roll_no": "Marks"}, inplace=True)

print "\nModified DataFrame"
print (pd.DataFrame(example_df))

输出:

Original DataFrame
    Name  Age  Marks  Roll_no
0   John   20     45       78
1  Peter   21     62       68
2   Scot   25     68       95

Modified DataFrame
    Name  Age  Roll_no  Marks
0   John   20       45     78
1  Peter   21       62     68
2   Scot   25       68     95

此方法的最大优点是你可以指定任意多的列。当你需要重命名特定的列时,这是非常有效的,并且与以前的方法不同,不需要为 DataFrame 列出整个列列表。

你可能会注意到,在 DataFrame.rename() 函数调用中,我们已将 inplace 参数指定为 Trueinplace 参数默认为 False,它指定是否返回新的 Pandas DataFrame。

将其指定为 True 表示函数调用不会返回新的 Pandas DataFrame,而是会更改现有的 DataFrame

使用 DataFrame.set_axis() 方法重命名 Pandas DataFrame 中的列

这是重命名 Pandas DataFrame 列的另一种便捷方法。使用此方法时,我们必须指定整个列列表。

import pandas as pd

example_df = pd.DataFrame(
    [["John", 20, 45, 78], ["Peter", 21, 62, 68], ["Scot", 25, 68, 95]],
    index=[0, 1, 2],
    columns=["Name", "Age", "Marks", "Roll_no"],
)

print "\nOriginal DataFrame"
print (pd.DataFrame(example_df))

example_df.set_axis(["Name", "Age", "Roll_no", "Marks"], axis="columns", inplace=True)

print "\nModified DataFrame"
print (pd.DataFrame(example_df))

输出:

Original DataFrame
    Name  Age  Marks  Roll_no
0   John   20     45       78
1  Peter   21     62       68
2   Scot   25     68       95

Modified DataFrame
    Name  Age  Roll_no  Marks
0   John   20       45     78
1  Peter   21       62     68
2   Scot   25       68     95

相关文章 - Pandas DataFrame