❗ Вебсайт в стадии бета-тестирования. Возможны ошибки.

Идентификаторы символа

Идентификаторы символа

Семантику символа (Character semantics) определяют: идентификаторы, нормативные свойства, правила применения символа, отношения к другим символам.

Идентификаторы символа (Character identity) — метаданные, однозначно определяющие символ. К метаданным идентификации относят:

  • наименование символа;
  • репрезентацию глифа;
  • идентификатор кодовой точки.

По любому из идентификаторов можно однозначно найти символ в Юникоде.

Наименование символа

Наименование символа (Character name) это уникальная строка, применяемая для идентификации абстрактного символа, кодированного в стандарте. Наименование символа формально служит свойством символа в базе данных. Наименование символа запрещено переопределять и изменять (например на русскоязычные соответствия). Это стабильные идентификаторы.

Псевдоним наименования (Character name alias) — дополнительный уникальный строковый идентификатора, отличный от наименования символа. Одному символу Юникода формально можно назначить множество псевдонимов.

Пространство наименований (Namespace) — набор наименований символов совместно с правилами сопоставления наименований. Все наименования символов уникальные в пределах пространства наименований.

Глиф символа

Глиф — визуальная форма представления абстрактного символа на носителе.

Стандарт Юникода не определяет изображение глифа. Он определяет значение символа, то как человек интерпретирует и понимает символ. Внешний вид глифа, форму, размер, размещение на экране определяет устройство визуализации и шрифт.

Носитель не имеет значения ни для символа, ни для глифа. В качестве носителя может выступать глина, пергамент, бумага, электронные устройства или нечто в будущем. Смена носителя не приводит к смене глифа и символа.

Идентификатор кодовой точки

Идентификатор кодовой точки Юникода записывают в шестнадцатеричной системе счисления. Вначале приводят комбинацию «U+», а далее от 4 до 6 цифр. Например, идентификатор «U+044F» присвоен кириллической букве «я».

Подробнее о кодовых точках изложено в разделе кодирование символов.