如何在 Pandas DataFrame 中重新命名列

  1. 使用 DataFrame.columns 方法重新命名 Pandas DataFrame 中的列
  2. 使用 DataFrame.rename() 方法重新命名 Pandas DataFrame 中的列
  3. 使用 DataFrame.set_axis() 方法重新命名 Pandas DataFrame 中的列

通常,我們需要在資料分析中操作列名。在本文中,我們將探索不同的方法來為已定義的 panadas DataFrame 操縱/重新命名列名。

使用 DataFrame.columns 方法重新命名 Pandas DataFrame 中的列

此方法非常簡單,可讓你直接重新命名列。我們可以使用 DataFrame.columns 屬性分配一個新的列名列表,如下所示:

import pandas as pd

example_df = pd.DataFrame([
                ['John', 20, 45], 
                ['Peter', 21, 62], 
                ['Scot', 25, 68]],
                index=[0, 1, 2], 
                columns=['Name', 'Age', 'Marks'])
                  
print"\nOriginal DataFrame"
print(pd.DataFrame(example_df))
example_df.columns = ['Name','Age','Roll_no']

print"\nModified DataFrame"
print(pd.DataFrame(example_df))

輸出:

Original DataFrame
    Name  Age  Marks
0   John   20     45
1  Peter   21     62
2   Scot   25     68

Modified DataFrame
    Name  Age  Roll_no
0   John   20       45
1  Peter   21       62
2   Scot   25       68

這種方法的一個缺點是,即使只需要重新命名一列,也必須列出整個列。當你有大量列時,指定整個列列表將變得不切實際。

使用 DataFrame.rename() 方法重新命名 Pandas DataFrame 中的列

前一種方法的替代方法是使用 DataFrame.rename() 方法。當我們不需要重新命名所有列時,此方法非常方便。

我們需要將舊列名稱指定為鍵,將新名稱指定為值。

import pandas as pd

example_df = pd.DataFrame([['John', 20, 45, 78], 
                           ['Peter', 21, 62, 68], 
                           ['Scot', 25, 68, 95]],
                           index=[0, 1, 2], 
                           columns=['Name', 'Age', 'Marks','Roll_no'])
                  
print"\nOriginal DataFrame"
print(pd.DataFrame(example_df))
example_df.rename(columns={'Marks': 'Roll_no', 
                           'Roll_no': 'Marks'}, inplace=True)

print"\nModified DataFrame"
print(pd.DataFrame(example_df))

輸出:

Original DataFrame
    Name  Age  Marks  Roll_no
0   John   20     45       78
1  Peter   21     62       68
2   Scot   25     68       95

Modified DataFrame
    Name  Age  Roll_no  Marks
0   John   20       45     78
1  Peter   21       62     68
2   Scot   25       68     95

此方法的最大優點是你可以指定任意多的列。當你需要重新命名特定的列時,這是非常有效的,並且與以前的方法不同,不需要為 Dataframe 列出整個列列表。

你可能會注意到,在 DataFrame.rename() 函式呼叫中,我們已將 inplace 引數指定為 Trueinplace 引數預設為 False,它指定是否返回新的 Pandas DataFrame。

將其指定為 True 表示函式呼叫不會返回新的 Pandas DataFrame,而是會更改現有的 DataFrame

使用 DataFrame.set_axis() 方法重新命名 Pandas DataFrame 中的列

這是重新命名 Pandas DataFrame 列的另一種便捷方法。使用此方法時,我們必須指定整個列列表。

import pandas as pd

example_df = pd.DataFrame([['John', 20, 45, 78], 
                           ['Peter', 21, 62, 68], 
                           ['Scot', 25, 68, 95]],
                           index=[0, 1, 2], 
                           columns=['Name', 'Age', 'Marks','Roll_no'])
                  
print"\nOriginal DataFrame"
print(pd.DataFrame(example_df))

example_df.set_axis(['Name', 'Age', 'Roll_no','Marks'], 
                    axis='columns', inplace=True)

print"\nModified DataFrame"
print(pd.DataFrame(example_df))

輸出:

Original DataFrame
    Name  Age  Marks  Roll_no
0   John   20     45       78
1  Peter   21     62       68
2   Scot   25     68       95

Modified DataFrame
    Name  Age  Roll_no  Marks
0   John   20       45     78
1  Peter   21       62     68
2   Scot   25       68     95

相關文章 - Pandas DataFrame

  • 如何計算值在 Pandas DataFrame 中出現的頻率
  • 在 Pandas 中獲取列與特定值匹配的行的索引