Möglichkeiten zum Entfernen von xa0 aus einem String in Python
-
Verwenden Sie die Funktion
Normalize()von Unicodedata, um\xa0aus einem String in Python zu entfernen -
Verwenden Sie die Funktion
replace()des Strings, um\xa0aus einem String in Python zu entfernen -
Verwendung der Funktion
get_text()der BibliothekBeautifulSoupmit der Einstellungstripauf True, um\xa0aus einem String in Python zu entfernen
Dieser Artikel stellt verschiedene Methoden vor, um \xa0 aus einem String in Python zu entfernen.
Der Unicode \xa0 repräsentiert ein hartes Leerzeichen oder ein Leerzeichen ohne Unterbrechung in einem Programm. Es wird als dargestellt. im HTML-Format.
Die Python-Funktionen, die helfen können, \xa0 aus einem String zu entfernen, sind wie folgt.
- Die Funktion
normalize()vonunicodedata - Die Funktion
replace()des Strings - Die Funktion
get_text()der BibliothekBeautifulSoupmit aktiviertemstripalsTrue.
Verwenden Sie die Funktion Normalize() von Unicodedata, um \xa0 aus einem String in Python zu entfernen
Mit der Funktion unicodedata normalize() der Standardbibliothek unicodedata können Sie \xa0 aus einem String entfernen.
Die Funktion normalize() wird wie folgt verwendet.
unicodedata.normalize("NFKD", string_to_normalize)
Dabei bezeichnet NFKD die normal form KD. Es ersetzt alle Kompatibilitätszeichen durch ihre entsprechenden Zeichen.
Das folgende Beispielprogramm veranschaulicht dies.
import unicodedata
str_hard_space = "17\xa0kg on 23rd\xa0June 2021"
print(str_hard_space)
xa = u"\xa0"
if xa in str_hard_space:
print("xa0 is Found!")
else:
print("xa0 is not Found!")
new_str = unicodedata.normalize("NFKD", str_hard_space)
print(new_str)
if xa in new_str:
print("xa0 is Found!")
else:
print("xa0 is not Found!")
Ausgabe:
17 kg on 23rd June 2021
xa0 is Found!
17 kg on 23rd June 2021
xa0 is not Found!
Verwenden Sie die Funktion replace() des Strings, um \xa0 aus einem String in Python zu entfernen
Sie können die Funktion replace() des Strings verwenden, um \xa0 aus einem String zu entfernen.
Die Funktion replace() wird wie folgt verwendet.
str_hard_space.replace(u"\xa0", u" ")
Das folgende Beispiel veranschaulicht dies.
str_hard_space = "16\xa0kg on 24th\xa0June 2021"
print(str_hard_space)
xa = u"\xa0"
if xa in str_hard_space:
print("xa0 Found!")
else:
print("xa0 not Found!")
new_str = str_hard_space.replace(u"\xa0", u" ")
print(new_str)
if xa in new_str:
print("xa0 Found!")
else:
print("xa0 not Found!")
Ausgabe:
16 kg on 24th June 2021
xa0 Found!
16 kg on 24th June 2021
xa0 not Found!
Verwendung der Funktion get_text() der Bibliothek BeautifulSoup mit der Einstellung strip auf True, um \xa0 aus einem String in Python zu entfernen
Sie können die Funktion get_text() der Standardbibliothek BeautifulSoup verwenden, wenn strip als True aktiviert ist, um \xa0 aus einem String zu entfernen.
Die Funktion get_text() wird wie folgt verwendet.
clean_html = BeautifulSoup(input_html, "lxml").get_text(strip=True)
Das folgende Beispiel veranschaulicht dies.
from bs4 import BeautifulSoup
html = "This is a test message, Hello This is a test message, Hello\xa0here"
print(html)
clean_text = BeautifulSoup(html, "lxml").get_text(strip=True)
print(clean_text)
Ausgabe:
Hello, This is a test message, Welcome to this website!
Hello, This is a test message, Welcome to this website!
Verwandter Artikel - Python String
- Entfernen Kommas aus String in Python
- Wie man überprüft, ob eine Zeichenkette auf eine pythonische Weise leer ist
- Konvertieren einer Zeichenkette in einen Variablennamen in Python
- Wie man Leerzeichen in einem String in Python entfernt
- Wie man in Python Zahlen aus einer Zeichenkette extrahiert
- Wie man in Python String in datetime konvertiert