La función utf8_encode en PHP

Subodh Poudel 20 junio 2023
  1. Introducción a UTF-8 y la función utf8_encode() en PHP
  2. Propósito de la función utf8_encode() en PHP
La función utf8_encode en PHP

Este artículo presentará la función utf8_encode() y explicará su propósito con ejemplos de código.

Introducción a UTF-8 y la función utf8_encode() en PHP

UTF-8 es una codificación de caracteres utilizada para Unicode. Se inventó porque el ASCII existente no podía codificar todos los caracteres existentes.

ASCII se limita a almacenar solo 256 caracteres y solo se puede usar para alfabetos en inglés (mayúsculas y minúsculas) y algunos caracteres especiales. Luego, surgió otra codificación ya que las páginas web trataban con muchos idiomas que se usan en todo el mundo y sus caracteres especiales.

ASCII no podía contenerlos todos debido a su espacio limitado. Por lo tanto, se introdujo el concepto de Unicode.

Con el uso de puntos de código, Unicode puede almacenar innumerables caracteres.

UTF-8 asigna cada punto de código a su equivalente binario. Como el nombre habla por sí mismo, utiliza 8 bits para almacenar un carácter.

En PHP, la función utf8_encode() convierte la cadena ISO-8859-1 a su versión UTF-8 equivalente. La cadena ISO-8859-1 es un conjunto de caracteres que se utilizó en HTML 4.01.

Los primeros 128 caracteres representados por este conjunto son los mismos que ASCII.

Sin embargo, la función utf8_encode() no verifica si su parámetro es una cadena ISO-8859-1. La función devuelve una cadena traducida UTF-8.

Veamos un ejemplo a continuación del uso de la función.

Código de ejemplo:

$iso_string = "&#49 &#50 &#51";
$utf8_string = utf8_encode($iso_string);
echo $utf8_string;

Producción :

1 2 3

En el ejemplo anterior, las cadenas &#49 &#50 &#51 son las codificaciones ISO-8859-1, traducidas a cadenas UTF-8. Aquí, &#49 equivale a 1, &#50 a 2 y &#51 a 3.

Propósito de la función utf8_encode() en PHP

El utf8_encode() gira en torno al concepto de la codificación UTF-8. La codificación se puede usar para transferir Unicode de una computadora a otra.

La función utf8_encode() se utiliza cuando necesitamos codificar algunos caracteres especiales en nuestra aplicación PHP.

Por ejemplo, almacene un carácter , un script de Devanagari, en la variable $char. Utilice la función utf8_encode() para codificar e imprimir el carácter codificado.

Si el archivo ya está codificado con UTF-8, no es necesario codificar los caracteres especiales con la función utf8_encode().

Código de ejemplo:

$char = "क";
$utf8_string = utf8_encode($char);
echo $utf8_string;

Producción :

à¤

Aquí, el carácter codificado en UTF-8, à¤, actúa como un código universal para el carácter que se puede utilizar en Internet. La computadora convierte la codificación en lenguaje máquina, una secuencia de bytes, para su interpretación.

Subodh Poudel avatar Subodh Poudel avatar

Subodh is a proactive software engineer, specialized in fintech industry and a writer who loves to express his software development learnings and set of skills through blogs and articles.

LinkedIn

Artículo relacionado - PHP Encode