在 Pandas 中把对象转换为浮点型

Manav Narula 2023年1月30日
  1. 在 Pandas 中使用 astype() 方法将对象转换为 Float
  2. 在 Pandas 中使用 to_numeric() 函数将对象转换为浮点型
在 Pandas 中把对象转换为浮点型

在本教程中,我们将重点介绍在 Pandas 中把对象型列转换为浮点数。对象型列包含一个字符串或其他类型的混合,而浮点数包含十进制值。在本文中,我们将对以下 DataFrame 进行操作。

import pandas as pd

df = pd.DataFrame(
    [["10.0", 6, 7, 8], ["1.0", 9, 12, 14], ["5.0", 8, 10, 6]],
    columns=["a", "b", "c", "d"],
)

print(df)
print("---------------------------")
print(df.info())

输出:

      a  b   c   d
0  10.0  6   7   8
1   1.0  9  12  14
2   5.0  8  10   6
---------------------------
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 4 columns):
 #   Column  Non-Null Count  Dtype 
---  ------  --------------  ----- 
 0   a       3 non-null      object
 1   b       3 non-null      int64 
 2   c       3 non-null      int64 
 3   d       3 non-null      int64 
dtypes: int64(3), object(1)
memory usage: 224.0+ bytes
None

注意列'a'的类型,它是 object 类型。我们将使用 Pandas 中的 pd.to_numeric()astype() 函数将这个对象转换为 float。

注意
本教程将不涉及 convert_objects() 函数的使用,该函数已被废弃并删除。

在 Pandas 中使用 astype() 方法将对象转换为 Float

Pandas 提供了 astype() 方法,用于将一列转换为特定类型。我们将 float 传递给该方法,并将参数 errors 设置为'raise',这意味着它将为无效值引发异常。例子:

import pandas as pd

df = pd.DataFrame(
    [["10.0", 6, 7, 8], ["1.0", 9, 12, 14], ["5.0", 8, 10, 6]],
    columns=["a", "b", "c", "d"],
)

df["a"] = df["a"].astype(float, errors="raise")

print(df.info())

输出:

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 4 columns):
a    3 non-null float64
b    3 non-null int64
c    3 non-null int64
d    3 non-null int64
dtypes: float64(1), int64(3)
memory usage: 224.0 bytes

在 Pandas 中使用 to_numeric() 函数将对象转换为浮点型

Pandas 的 to_numeric() 函数可以用来将列表、系列、数组或元组转换为数字数据类型,也就是有符号、无符号的整型和浮点数类型。它还有 errors 参数来引发异常。下面是一个使用 to_numeric() 将对象类型转换为浮点类型的例子。

import pandas as pd

df = pd.DataFrame(
    [["10.0", 6, 7, 8], ["1.0", 9, 12, 14], ["5.0", 8, 10, 6]],
    columns=["a", "b", "c", "d"],
)

df["a"] = pd.to_numeric(df["a"], errors="coerce")

print(df.info())

输出:

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 4 columns):
a    3 non-null float64
b    3 non-null int64
c    3 non-null int64
d    3 non-null int64
dtypes: float64(1), int64(3)
memory usage: 224.0 bytes
作者: Manav Narula
Manav Narula avatar Manav Narula avatar

Manav is a IT Professional who has a lot of experience as a core developer in many live projects. He is an avid learner who enjoys learning new things and sharing his findings whenever possible.

LinkedIn

相关文章 - Pandas DataFrame