Python で文字列を Unicode に変換する

Muhammad Maisam Abbas 2023年1月30日
  1. Python 2 で文字列を Unicode に変換する
  2. Python 3 で文字列を Unicode 形式に変換する
Python で文字列を Unicode に変換する

このチュートリアルでは、Python で通常の文字列を Unicode 文字列に変換する方法について説明します。

Python 2 で文字列を Unicode に変換する

Python 2 では、通常の文字列はバイト文字列と呼ばれ、組み込みの unicode() 関数を使用してこれらのバイト文字列を Unicode 文字列に変換できます。このコードスニペットは、Python 2 で通常の文字列を Unicode 文字列に変換する方法を示しています。

regular = "regular string"
unicode_string = unicode(regular, "utf-8")
print(type(regular))
print(type(unicode_string))

出力:

<type 'str'>
<type 'unicode'>

Python 2 の unicode() 関数を使用して、通常のバイト文字列を Unicode 文字列に変換しました。

Python 3 で文字列を Unicode 形式に変換する

Python 3 では、文字列はデフォルトで Unicode 文字列であり、通常の文字列を Unicode 文字列に変換する方法はありません。したがって、次のコードは Python 2 と Python 3 で異なる結果をもたらします。

regular = "regular string"
unicode_string = u"Unicode string"
print(type(regular))
print(type(unicode_string))

Python 2 の出力:

<type 'str'>
<type 'unicode'>

Python 3 の出力:

<class 'str'>
<class 'str'>

上記のコードでは、Python 2 と Python 3 の両方で Unicode 文字列を初期化します。Python 2 では、通常の文字列と Unicode 文字列に違いがあるため、文字列はクラス unicode に属しますが、Python 3 では文字列クラス str に属しています。結局のところ、Unicode 文字列は通常の文字列と同じです。

Muhammad Maisam Abbas avatar Muhammad Maisam Abbas avatar

Maisam is a highly skilled and motivated Data Scientist. He has over 4 years of experience with Python programming language. He loves solving complex problems and sharing his results on the internet.

LinkedIn