Skip to content

Основные литералы значений: литералы значений рун

Типы рун, в том числе определяемые пользователем типы рун и встроенный rune тип (также известный как int32 тип), являются специальными целочисленными типами. Поэтому все значения рун могут быть обозначены целочисленными литералами, представленными выше. С другой стороны, многие значения всех видов целочисленных типов также могут быть представлены руническими литералами, описанными ниже в текущей главе. 

Значение руны предназначено для хранения кодовой точки Unicode. Как правило, мы можем рассматривать кодовую точку как символ Unicode, но мы должны знать, что некоторые символы Unicode состоят из более чем одной кодовой точки каждый. 

Рунический литерал выражается одним или несколькими символами, заключенными в пару кавычек. Заключенные символы обозначают одно значение кодовой точки Unicode. Есть несколько второстепенных вариантов буквальной формы рун. Самая популярная форма литералов рун — просто заключать символы, обозначаемые значениями рун, между двумя одинарными кавычками. Например:

Следующие варианты литерала руны эквивалентны 'a' (значение символа Unicode равно a 97).

Обрати внимание на \ —  за ним должны следовать ровно три восьмеричных цифры для представления значения байта, \x — за ним должны следовать ровно две шестнадцатеричные цифры для представления байтового значения, \u — за которым должны следовать ровно четыре шестнадцатеричных цифры для представления значения руны, и \U — за ним должен следовать ровно восемь шестнадцатеричных цифр для представления значения руны. Каждая такая восьмеричная или шестнадцатеричная последовательность цифр должна представлять допустимую кодовую точку Unicode, иначе она не скомпилируется. 

Следующая программа напечатает семь true текстов.

Фактически, только что упомянутые четыре разновидности буквенных форм рун редко используются для значений рун на практике. Иногда они используются в интерпретируемых строковых литералах.

Если рунический литерал состоит из двух символов, не считая двух кавычек, первый из которых является символом \, а второй не является цифровым символом, x и u, U то два последовательных символа будут экранированы как один специальный символ. Возможные пары символов для экранирования представлены на картинке ниже.

\n является наиболее часто используемой парой escape-символов. 

Пример:

Существует много литералов, которые могут обозначать нулевые значения типов рун, таких как '\000', '\x00', '\u0000', и т. д. Мы также можем использовать любой числовой литерал, введенный выше, для представления значений типов рун, таких как 0, 0x0, 0.0, 0e0, 0i и т. д.