JavaScript 中的 Unicode

Shiv Yadav 2023年10月12日
JavaScript 中的 Unicode

本文幫助你瞭解在 JavaScript 中插入 Unicode 字元的情況。

JavaScript 中的 Unicode

根據 ES2015 規範,原始碼文字使用 Unicode(5.1 及更高版本)表示。源文字由範圍從 U+0000U+10FFFF 的程式碼點組成。

如何儲存或交換原始碼對 ECMAScript 標準並不重要;但是,它通常被編碼為 UTF-8。

在 JavaScript 中插入 Unicode 字元有兩種方法;使用 Unicode 轉義序列和 String.fromCodePoint

Unicode 轉義序列

字串轉義序列基於程式碼點編號傳達程式碼單元。

JavaScript 中的 3 種轉義型別:

  1. 十六進位制轉義
  2. Unicode 轉義
  3. 碼點轉義

要插入 Omega,你可以使用 Unicode 轉義序列\u{XXXXXX} 轉義 Unicode 程式碼點(其中 X 表示 U+0000U+10FFFF 範圍內的 1-6 個十六進位制數字,涵蓋了完整的 Unicode)。

例如,要將 Omega,即 (U+03A9) 插入 JavaScript 字串,你可以按以下方式進行。

const ome = 'Omega: \u{03A9}';
console.log(ome);

執行程式碼

輸出:

"Omega: Ω"

Unicode 已經發展到包含 BMP(基本多語言平面)中未包含的其他字元。這些字元由代理對表示,在早期版本的 JavaScript 中無法直接新增程式碼點。

需要兩個相鄰的 Unicode 轉義序列來適當地表示這些字元。

在 JavaScript 中使用 String.fromCodePoint()

使用 String.fromCodePoint() 函式,你可以將 Unicode 程式碼點新增到 JavaScript 字串。它需要一系列程式碼點(十進位制、十六進位制、八進位制等)作為輸入。

例如,使用十進位制程式碼點來顯示 Omega

const omee = `Omega: ${String.fromCodePoint(937)}`;
console.log(omee);

執行程式碼

輸出:

"Omega: Ω"
作者: Shiv Yadav
Shiv Yadav avatar Shiv Yadav avatar

Shiv is a self-driven and passionate Machine learning Learner who is innovative in application design, development, testing, and deployment and provides program requirements into sustainable advanced technical solutions through JavaScript, Python, and other programs for continuous improvement of AI technologies.

LinkedIn