JavaScript 中的 Unicode

Shiv Yadav 2023年10月12日
JavaScript 中的 Unicode

本文帮助你了解在 JavaScript 中插入 Unicode 字符的情况。

JavaScript 中的 Unicode

根据 ES2015 规范,源代码文本使用 Unicode(5.1 及更高版本)表示。源文本由范围从 U+0000U+10FFFF 的代码点组成。

如何保存或交换源代码对 ECMAScript 标准并不重要;但是,它通常被编码为 UTF-8。

在 JavaScript 中插入 Unicode 字符有两种方法;使用 Unicode 转义序列和 String.fromCodePoint

Unicode 转义序列

字符串转义序列基于代码点编号传达代码单元。

JavaScript 中的 3 种转义类型:

  1. 十六进制转义
  2. Unicode 转义
  3. 码点转义

要插入 Omega,你可以使用 Unicode 转义序列\u{XXXXXX} 转义 Unicode 代码点(其中 X 表示 U+0000U+10FFFF 范围内的 1-6 个十六进制数字,涵盖了完整的 Unicode)。

例如,要将 Omega,即 (U+03A9) 插入 JavaScript 字符串,你可以按以下方式进行。

const ome = 'Omega: \u{03A9}';
console.log(ome);

运行代码

输出:

"Omega: Ω"

Unicode 已经发展到包含 BMP(基本多语言平面)中未包含的其他字符。这些字符由代理对表示,在早期版本的 JavaScript 中无法直接添加代码点。

需要两个相邻的 Unicode 转义序列来适当地表示这些字符。

在 JavaScript 中使用 String.fromCodePoint()

使用 String.fromCodePoint() 函数,你可以将 Unicode 代码点添加到 JavaScript 字符串。它需要一系列代码点(十进制、十六进制、八进制等)作为输入。

例如,使用十进制代码点来显示 Omega

const omee = `Omega: ${String.fromCodePoint(937)}`;
console.log(omee);

运行代码

输出:

"Omega: Ω"
作者: Shiv Yadav
Shiv Yadav avatar Shiv Yadav avatar

Shiv is a self-driven and passionate Machine learning Learner who is innovative in application design, development, testing, and deployment and provides program requirements into sustainable advanced technical solutions through JavaScript, Python, and other programs for continuous improvement of AI technologies.

LinkedIn