將 Pandas DataFrame 轉換為字典

Manav Narula 2023年1月30日
  1. 使用 to_dict() 函式將 Pandas DataFrame 轉換為字典
  2. Pandas DataFrame 轉換字典的方法
  3. Pandas DataFrame 轉換為字典列表
  4. Pandas DataFrame 按行轉為字典
  5. Dataframe 轉為以一列為鍵的字典
  6. 使用 dict()zip() 函式將 Pandas DataFrame 轉為字典
將 Pandas DataFrame 轉換為字典

本教程將介紹如何將 Pandas DataFrame 轉換為以索引列元素為鍵,其他列的相應元素為值的字典。我們將在文章中使用以下 DataFrame。

import pandas as pd

df = pd.DataFrame(
    [["Jay", 16, "BBA"], ["Jack", 19, "BTech"], ["Mark", 18, "BSc"]],
    columns=["Name", "Age", "Course"],
)

print(df)

輸出:

   Name  Age Course
0   Jay   16    BBA
1  Jack   19  BTech
2  Mark   18    BSc

使用 to_dict() 函式將 Pandas DataFrame 轉換為字典

Pandas to_dict() 函式將一個 DataFrame 轉換為一個字典。引數決定了字典的格式和鍵值對的關聯方式。下面是一個使用 to_dict() 將 DataFrame 轉換為 Dictionary 的基本示例。

import pandas as pd

df = pd.DataFrame(
    [["Jay", 16, "BBA"], ["Jack", 19, "BTech"], ["Mark", 18, "BSc"]],
    columns=["Name", "Age", "Course"],
)

d1 = df.to_dict()
print(d1)

輸出:

{'Name': {0: 'Jay', 1: 'Jack', 2: 'Mark'}, 'Age': {0: 16, 1: 19, 2: 18}, 'Course': {0: 'BBA', 1: 'BTech', 2: 'BSc'}}

正如你在輸出中看到的,列名被轉換為鍵,每條記錄作為值,索引作為它們的鍵。

Pandas DataFrame 轉換字典的方法

我們可以通過引數 listrecordsseriesindexsplitdict 來改變最終字典的格式。例如,當我們傳遞 listseries 作為引數時,我們將列名作為鍵,但值對分別被轉換為列表和系列行。下面的例子將證明這一點。

import pandas as pd

df = pd.DataFrame(
    [["Jay", 16, "BBA"], ["Jack", 19, "BTech"], ["Mark", 18, "BSc"]],
    columns=["Name", "Age", "Course"],
)

d_list = df.to_dict("list")
print(d_list)

d_series = df.to_dict("series")
print(d_series)

輸出:

{'Name': ['Jay', 'Jack', 'Mark'], 'Age': [16, 19, 18], 'Course': ['BBA', 'BTech', 'BSc']}

{'Name': 0     Jay
1    Jack
2    Mark
Name: Name, dtype: object, 'Age': 0    16
1    19
2    18
Name: Age, dtype: int64, 'Course': 0      BBA
1    BTech
2      BSc
Name: Course, dtype: object}

Pandas DataFrame 轉換為字典列表

我們也可以將每一行作為一個單獨的字典傳遞給函式 records。最後的結果是一個列表,每一行都是一個字典。例如:

import pandas as pd

df = pd.DataFrame(
    [["Jay", 16, "BBA"], ["Jack", 19, "BTech"], ["Mark", 18, "BSc"]],
    columns=["Name", "Age", "Course"],
)

d_records = df.to_dict("records")
print(d_records)

輸出:

[{'Name': 'Jay', 'Age': 16, 'Course': 'BBA'}, {'Name': 'Jack', 'Age': 19, 'Course': 'BTech'}, {'Name': 'Mark', 'Age': 18, 'Course': 'BSc'}]

Pandas DataFrame 按行轉為字典

但是在很多情況下,我們可能不希望列名作為字典的鍵。對於這種情況,我們可以傳遞 index 來使 DataFrame 索引作為鍵。下面的程式碼片段展示了這一點。

import pandas as pd

df = pd.DataFrame(
    [["Jay", 16, "BBA"], ["Jack", 19, "BTech"], ["Mark", 18, "BSc"]],
    columns=["Name", "Age", "Course"],
)

d_index = df.to_dict("index")
print(d_index)

輸出:

{0: {'Name': 'Jay', 'Age': 16, 'Course': 'BBA'}, 1: {'Name': 'Jack', 'Age': 19, 'Course': 'BTech'}, 2: {'Name': 'Mark', 'Age': 18, 'Course': 'BSc'}}

Dataframe 轉為以一列為鍵的字典

但是,如果我們喜歡用一列的元素作為鍵,而用其他列的元素作為值呢?這可以通過簡單地將所需的列作為 DataFrame 的索引,並使用 .T() 函式對其進行轉置來實現。

例子:

import pandas as pd

df = pd.DataFrame(
    [["Jay", 16, "BBA"], ["Jack", 19, "BTech"], ["Mark", 18, "BSc"]],
    columns=["Name", "Age", "Course"],
)

d_names = df.set_index("Name").T.to_dict("list")
print(d_names)

輸出:

{'Jay': [16, 'BBA'], 'Jack': [19, 'BTech'], 'Mark': [18, 'BSc']}

使用 dict()zip() 函式將 Pandas DataFrame 轉為字典

Python dict() 函式也可以將 Pandas DataFrame 轉換為字典。我們還應該使用 zip() 函式,將各個列作為它的引數來建立並行迭代器。然後 zip() 函式將在每次迭代中產生一行的所有值。

import pandas as pd

df = pd.DataFrame(
    [["Jay", 16, "BBA"], ["Jack", 19, "BTech"], ["Mark", 18, "BSc"]],
    columns=["Name", "Age", "Course"],
)

d = dict([(i, [a, b]) for i, a, b in zip(df["Name"], df["Age"], df["Course"])])
print(d)

輸出:

{'Jay': [16, 'BBA'], 'Jack': [19, 'BTech'], 'Mark': [18, 'BSc']}
作者: Manav Narula
Manav Narula avatar Manav Narula avatar

Manav is a IT Professional who has a lot of experience as a core developer in many live projects. He is an avid learner who enjoys learning new things and sharing his findings whenever possible.

LinkedIn

相關文章 - Pandas DataFrame