UTF-8 in Python decodieren
Kodierung bezieht sich auf die Kodierung eines Strings mit einem Kodierungsschema wie UTF-8. Decodieren bezieht sich auf das Konvertieren einer codierten Zeichenfolge von einer Codierung in ein anderes Codierungsschema.
In diesem Artikel lernen wir, wie man eine im UTF-8-Format kodierte Zeichenfolge in Python dekodiert.
Dekodierung von UTF-8-Strings in Python
Um eine im UTF-8-Format codierte Zeichenfolge zu decodieren, können wir die für Zeichenketten angegebene decode()-Methode verwenden.
Diese Methode akzeptiert zwei Argumente, encoding und error. encoding übernimmt die Codierung des zu decodierenden Strings und error entscheidet, wie mit Fehlern umgegangen wird, die beim Decodieren auftreten.
Das Argument error akzeptiert nur zwei Werte: strict und ignore. strict löst einen Unicode-Fehler aus, wenn ein Fehler auftritt, und ignore ignoriert die Fehler. Die Methode decode() gibt den ursprünglichen String zurück.
Sehen Sie sich den folgenden Python-Code an, um zu verstehen, wie die Methode decode() verwendet wird.
s = "Hello World"
encoded = s.encode("UTF-8")
decoded = encoded.decode("UTF-8")
print("Encoded String:", encoded)
print("Decoded String:", decoded)
Ausgabe:
Encoded String: b'Hello World'
Decoded String: Hello World
