Go rune

Jay Singh 2023년1월30일
  1. Go에서 Rune 사용 예
  2. Go에서 백슬래시 \와 함께 룬 사용
  3. Go에서 byte()rune() 비교
Go rune

Go에서 룬은 유니코드 코드 포인트를 나타내는 int32 데이터 유형의 별칭입니다. 유니코드 문자에 할당된 숫자 값을 나타냅니다.

몇 년 전 우리는 대문자, 숫자 값 등을 포함하여 182자를 나타내는 데 7비트를 사용하는 ASCII 문자 집합을 사용했습니다. 대조적으로 ASCII 문자 집합은 세계에서 가장 큰 숫자를 처리할 수 없음이 입증되었습니다. 언어와 상징의.

이 문제를 해결하기 위해 유니코드 문자 인코딩이 만들어졌습니다. 최대 1114112 유니코드 코드 포인트가 있는 ASCII 문자 인코딩의 상위 집합입니다.

더 나은 이해를 위해 몇 가지 예를 살펴보겠습니다.

Go에서 Rune 사용 예

package main

import (
    "fmt"
    "reflect"
    "unsafe"
)

func main() {
    r := 'b'

    fmt.Printf("Size: %d\n", unsafe.Sizeof(r))
    fmt.Printf("Type: %s\n", reflect.TypeOf(r))
    fmt.Printf("Unicode CodePoint: %U\n", r)
    fmt.Printf("Character: %c\n", r)

    s := "Jay Singh"

    fmt.Printf("%U\n", []rune(s))
    fmt.Println([]rune(s))
}

출력:

Size: 4
Type: int32
Unicode CodePoint: U+0062
Character: b
[U+004A U+0061 U+0079 U+0020 U+0053 U+0069 U+006E U+0067 U+0068]
[74 97 121 32 83 105 110 103 104]

Go에서 백슬래시 \와 함께 룬 사용

백슬래시로 시작하는 모든 시퀀스는 룬 리터럴에서 금지됩니다.

package main

import (
    "fmt"
    "reflect"
)

func main() {

    rune1 := 'J'
    rune2 := 'c'
    rune3 := '\\'

    fmt.Printf("Rune 1: %c; Unicode: %U; Type: %s", rune1,
        rune1, reflect.TypeOf(rune1))

    fmt.Printf("\nRune 2: %c; Unicode: %U; Type: %s", rune2,
        rune2, reflect.TypeOf(rune2))

    fmt.Printf("\nRune 3: Unicode: %U; Type: %s", rune3,
        rune3, reflect.TypeOf(rune3))
}

출력:

Rune 1: J; Unicode: U+004A; Type: int32
Rune 2: c; Unicode: U+0063; Type: int32
Rune 3: Unicode: U+005C; Type: %!s(int32=92)%!(EXTRA *reflect.rtype=int32)

Go에서 byte()rune() 비교

이 예제에서 ASCII가 아닌 문자를 포함하는 문자열의 바이트 배열과 룬을 출력해 보겠습니다. 특수 유니코드 문자 룬 값은 214입니다. 그러나 인코딩에는 2바이트가 필요합니다.

package main

import (
    "fmt"
)

func main() {
    s := "GÖ"

    s_rune := []rune(s)
    s_byte := []byte(s)

    fmt.Println(s_rune)
    fmt.Println(s_byte)
}

출력:

[71 214]
[71 195 150]