Python에서 UTF8 인코딩

Fariba Laiq 2022년8월18일
Python에서 UTF8 인코딩

UTF는 유니코드 변환 형식을 나타냅니다. 유니코드에 포함된 모든 문자를 1~4바이트의 이진 문자열로 인코딩하는 가변 너비 인코딩 시스템입니다.

중국어와 같은 국제 문자의 표현을 허용합니다. 또한 ASCII와 하위 호환됩니다.

UTF-8은 주로 이메일 및 웹 페이지를 인코딩하는 데 사용됩니다.

encode()를 사용하여 Python에서 UTF-8로 문자열 인코딩

Python에서 문자열을 UTF-8로 인코딩하려면 encode() 메서드를 사용합니다. 인코딩된 버전의 문자열을 반환하는 내장 메서드입니다.

기본적으로 인수를 사용하지 않고 문자열을 UTF-8로 변환합니다. 그러나 encodingerrors라는 두 개의 선택적 매개변수를 허용할 수 있습니다.

encoding은 사용된 인코딩 기술을 나타내며 errors는 인코딩 실패 시 응답을 나타냅니다. 기본 응답은 실패 시 UnicodeDecodeError 예외를 발생시키는 strict입니다.

다음 코드에서는 ï이라는 특수 문자가 포함된 Naïve라는 단어를 인코딩했습니다. encode() 메소드는 전체 텍스트를 UTF-8 버전으로 변환합니다.

예제 코드:

string = "Naïve"
print("String before encoding:", string)
print("String after encoding:", string.encode())

출력:

String before encoding: Naïve
String after encoding: b'Na\xc3\xafve'
작가: Fariba Laiq
Fariba Laiq avatar Fariba Laiq avatar

I am Fariba Laiq from Pakistan. An android app developer, technical content writer, and coding instructor. Writing has always been one of my passions. I love to learn, implement and convey my knowledge to others.

LinkedIn