在 Python 中从字符串中删除 xa0 的方法

Najwa Riyaz 2023年1月30日
  1. 使用 Unicodedata 的 Normalize() 函数从 Python 中的字符串中删除 \xa0
  2. 使用字符串的 replace() 函数从 Python 中的字符串中删除 \xa0
  3. 使用 BeautifulSoup 库的 get_text() 函数将 strip 设为 True 从 Python 中的字符串中删除 \xa0
在 Python 中从字符串中删除 xa0 的方法

本文介绍了在 Python 中从字符串中删除 \xa0 的不同方法。

\xa0 Unicode 代表程序中的硬空间或不间断空间。它表示为  在 HTML 中。

可以帮助从字符串中删除 \xa0 的 Python 函数如下。

  • unicodedatanormalize() 函数
  • 字符串的 replace() 函数
  • BeautifulSoup 库的 get_text() 函数将 strip’ 设为 True

使用 Unicodedata 的 Normalize() 函数从 Python 中的字符串中删除 \xa0

你可以使用 unicodedata 标准库的 unicodedata normalize() 函数从字符串中删除 \xa0

normalize() 函数使用如下。

unicodedata.normalize("NFKD", string_to_normalize)

这里,NFKD 表示 normal form KD。它将所有兼容字符替换为其等效字符。

下面的示例程序说明了这一点。

import unicodedata

str_hard_space = "17\xa0kg on 23rd\xa0June 2021"
print(str_hard_space)
xa = u"\xa0"

if xa in str_hard_space:
    print("xa0 is Found!")
else:
    print("xa0 is not Found!")


new_str = unicodedata.normalize("NFKD", str_hard_space)
print(new_str)
if xa in new_str:
    print("xa0 is Found!")
else:
    print("xa0 is not Found!")

输出:

17 kg on 23rd June 2021
xa0 is Found!
17 kg on 23rd June 2021
xa0 is not Found!

使用字符串的 replace() 函数从 Python 中的字符串中删除 \xa0

你可以使用字符串的 replace() 函数从字符串中删除 \xa0

replace() 函数的用法如下。

str_hard_space.replace(u"\xa0", u" ")

下面的例子说明了这一点。

str_hard_space = "16\xa0kg on 24th\xa0June 2021"
print(str_hard_space)
xa = u"\xa0"

if xa in str_hard_space:
    print("xa0 Found!")
else:
    print("xa0 not Found!")

new_str = str_hard_space.replace(u"\xa0", u" ")
print(new_str)
if xa in new_str:
    print("xa0 Found!")
else:
    print("xa0 not Found!")

输出:

16 kg on 24th June 2021
xa0 Found!
16 kg on 24th June 2021
xa0 not Found!

使用 BeautifulSoup 库的 get_text() 函数将 strip 设为 True 从 Python 中的字符串中删除 \xa0

你可以使用 BeautifulSoup 标准库的 get_text() 函数和 strip 启用为 True 从字符串中删除 \xa0

get_text() 函数的用法如下。

clean_html = BeautifulSoup(input_html, "lxml").get_text(strip=True)

下面的例子说明了这一点。

from bs4 import BeautifulSoup

html = "This is a test message, Hello This is a test message, Hello\xa0here"
print(html)

clean_text = BeautifulSoup(html, "lxml").get_text(strip=True)

print(clean_text)

输出:

Hello, This is a test message, Welcome to this website!
Hello, This is a test message, Welcome to this website!

相关文章 - Python String