PHP의 utf8_encode 함수

Subodh Poudel 2023년6월20일
  1. UTF-8 소개 및 PHP의 utf8_encode() 함수
  2. PHP에서 utf8_encode() 함수의 목적
PHP의 utf8_encode 함수

이 기사에서는 utf8_encode() 함수를 소개하고 코드 예제와 함께 그 목적을 설명합니다.

UTF-8 소개 및 PHP의 utf8_encode() 함수

UTF-8은 유니코드에 사용되는 문자 인코딩입니다. 기존 ASCII가 기존의 모든 문자를 인코딩할 수 없었기 때문에 발명되었습니다.

ASCII는 256자만 저장할 수 있으며 영어 알파벳(대문자 및 소문자) 및 일부 특수 문자에만 사용할 수 있습니다. 그런 다음 웹 페이지가 전 세계적으로 사용되는 많은 언어와 특수 문자를 다루면서 또 다른 인코딩이 발생했습니다.

ASCII는 제한된 공간으로 인해 모든 항목을 저장할 수 없습니다. 그래서 유니코드라는 개념이 도입되었습니다.

코드 포인트를 사용하면 유니코드는 수많은 문자를 저장할 수 있습니다.

UTF-8은 각 코드 포인트를 해당 바이너리에 매핑합니다. 이름에서 알 수 있듯이 8비트를 사용하여 문자를 저장합니다.

PHP에서 utf8_encode() 함수는 ISO-8859-1 문자열을 동등한 UTF-8 버전으로 변환합니다. ISO-8859-1 문자열은 HTML 4.01에서 사용된 문자 집합입니다.

이 집합이 나타내는 처음 128자는 ASCII와 동일합니다.

그러나 utf8_encode() 함수는 해당 매개변수가 ISO-8859-1 문자열인지 여부를 확인하지 않습니다. 이 함수는 UTF-8로 번역된 문자열을 반환합니다.

함수를 사용하는 예를 아래에서 살펴보겠습니다.

예제 코드:

$iso_string = "&#49 &#50 &#51";
$utf8_string = utf8_encode($iso_string);
echo $utf8_string;

출력:

1 2 3

위의 예에서 &#49 &#50 &#51 문자열은 ISO-8859-1 인코딩이며 UTF-8 문자열로 변환됩니다. 여기서 &#491, &#50에서 2, &#51에서 3에 해당합니다.

PHP에서 utf8_encode() 함수의 목적

utf8_encode()는 UTF-8 인코딩의 개념을 중심으로 합니다. 인코딩은 한 컴퓨터에서 다른 컴퓨터로 유니코드를 전송하는 데 사용할 수 있습니다.

utf8_encode() 함수는 PHP 애플리케이션에서 일부 특수 문자를 인코딩해야 할 때 사용됩니다.

예를 들어 Devanagari 스크립트인 c 문자를 $char 변수에 저장합니다. utf8_encode() 함수를 사용하여 인코딩된 문자를 인코딩하고 인쇄합니다.

파일이 이미 UTF-8로 인코딩된 경우 utf8_encode() 함수로 특수 문자를 인코딩할 필요가 없습니다.

예제 코드:

$char = "क";
$utf8_string = utf8_encode($char);
echo $utf8_string;

출력:

à¤

여기서 UTF-8로 인코딩된 문자 à¤는 인터넷에서 사용할 수 있는 문자 ca에 대한 범용 코드 역할을 합니다. 컴퓨터는 해석을 위해 인코딩을 바이트 시퀀스인 기계어로 변환합니다.

Subodh Poudel avatar Subodh Poudel avatar

Subodh is a proactive software engineer, specialized in fintech industry and a writer who loves to express his software development learnings and set of skills through blogs and articles.

LinkedIn