追加到 Pandas 中的空 DataFrame

Preet Sanghavi 2023年1月30日
  1. 在 Pandas 中创建一个空 DataFrame 并添加行和列
  2. 将行附加到具有 Pandas 列的空 DataFrame
  3. 使用 Pandas 中的 .loc() 函数创建一个空 DataFrame,包括带有索引的列和附加行
追加到 Pandas 中的空 DataFrame

正如我们之前所了解的,Python 中的 Pandas 是一个开源模块,我们可以使用它进行数据分析和制作机器学习模型。它与另一个名为 Numpy 的包一起使用,因为它们携手支持多维数组。

许多数据科学模块可以与 Python 生态系统中的 Pandas 一起使用。我们将学习在 Pandas 中附加到空 DataFrame 的不同操作。

DataFrame 是表格形式的二维和潜在的异构数据。

本教程教授如何使用 Python 在 Pandas 的空 DataFrame 中添加行和列。我们将研究三种不同的方法来向空 DataFrame 添加数据,因为有多种方法。

在 Pandas 中创建一个空 DataFrame 并添加行和列

下面是导入所需包、制作空 DataFrame 和附加列的代码。

# import pandas library as pd
import pandas as pd

# create an Empty DataFrame object
df = pd.DataFrame()
print(df)
# append columns to an empty DataFrame
df["Name"] = ["Preet", "Parin", "Rajesh"]
df["Articles"] = [97, 600, 200]
df["Improved"] = [2200, 75, 100]

print(df)

上述代码片段的输出如下。

Empty DataFrame
Columns: []
Index: []
	Name	Articles  Improved
0	Preet	97		  2200
1	Parin	600		  75
2	Rajesh 	200		  100

在我们添加列和行之前,DataFrame 是空的。因此,打印空 DataFrame 为我们提供了输出 Empty DataFrame, Columns: [], Index: [] 作为输出,这是预期的,因为数据为空。

将行附加到具有 Pandas 列的空 DataFrame

在这个方法中,DataFrame 是空的,但是会有预定义的列名,我们唯一的任务就是在它下面的行中插入数据。

下面是上述方法的代码,我们最初导入库 Pandas,创建一个包含列的 DataFrame,然后以行的形式附加值。

# import pandas library as pd
import pandas as pd

# create an Empty DataFrame
# object With column names only
df = pd.DataFrame(columns=["Name", "Articles", "Improved"])
print(df)

# append rows to an empty DataFrame
df = df.append({"Name": "Preet", "Articles": 97, "Improved": 2200}, ignore_index=True)
df = df.append({"Name": "Parin", "Articles": 30, "Improved": 50}, ignore_index=True)
df = df.append({"Name": "Rajesh", "Articles": 17, "Improved": 220}, ignore_index=True)
print(df)

该代码将为我们提供以下输出。

Empty DataFrame
Columns: [Name, Articles, Improved]
Index: []
	Name	Articles  Improved
0	Preet	97		  2200
1	Parin	30	      50
2	Rajesh	17		  220

正如我们所看到的,由于我们已经在 DataFrame 中添加了列的名称,因此输出由 Columns: [Name, Articles, Improvement] 组成,它是数组中的列名称。

以下输出是因为我们使用了 .append() 函数。

使用 Pandas 中的 .loc() 函数创建一个空 DataFrame,包括带有索引的列和附加行

Pandas 中的 .loc() 方法可帮助用户轻松地从 DataFrame 中检索值,而不会带来任何复杂性。可以根据函数中传递的索引值访问特定行和列中的值。

在这种方法中,我们将创建一个空的 DataFrame 和列名。将使用索引来识别每一列来访问它。

接下来我们将一个接一个地追加行。

下面给出了证明这种方法的代码。

# import pandas library as pd
import pandas as pd

# create an Empty DataFrame object With
# column names and indices
df = pd.DataFrame(columns=["Name", "Articles", "Improved"], index=["a", "b", "c"])

print("Empty DataFrame With NaN values : \n\n", df)

# adding rows to an empty
# dataframe at existing index
df.loc["a"] = ["Preet", 50, 100]
df.loc["b"] = ["Parin", 60, 120]
df.loc["c"] = ["Rajesh", 30, 60]
print(df)

上面给出的代码的输出如下。

Empty DataFrame With NaN values :

   Name  Articles  Improved
a  NaN      NaN      NaN
b  NaN      NaN      NaN
c  NaN      NaN      NaN
   Name  Articles  Improved
a  Preet	50		 100
b  Parin	60	     120
c  Rajesh	30		 60

正如我们所观察到的,第一个表中的 NaN 值是因为我们提到了索引,但这些值仍然为空。

提供索引的数量会将表绑定到该特定实例的那么多值。增加索引的数量允许插入更多的值。

因此,在本教程中,我们学习了在 Pandas 中将值附加到 DataFrame 的三种不同方法。

作者: Preet Sanghavi
Preet Sanghavi avatar Preet Sanghavi avatar

Preet writes his thoughts about programming in a simplified manner to help others learn better. With thorough research, his articles offer descriptive and easy to understand solutions.

LinkedIn GitHub

相关文章 - Pandas DataFrame