Идентификаторы символа
Идентификаторы символа
Семантику символа (Character semantics) определяют: идентификаторы, нормативные свойства, правила применения символа, отношения к другим символам.
Идентификаторы символа (Character identity) — метаданные, однозначно определяющие символ. К метаданным идентификации относят:
- наименование символа;
- репрезентацию глифа;
- идентификатор кодовой точки.
По любому из идентификаторов можно однозначно найти символ в Юникоде.
Наименование символа
Наименование символа (Character name) это уникальная строка, применяемая для идентификации абстрактного символа, кодированного в стандарте. Наименование символа формально служит свойством символа в базе данных. Наименование символа запрещено переопределять и изменять (например на русскоязычные соответствия). Это стабильные идентификаторы.
Псевдоним наименования (Character name alias) — дополнительный уникальный строковый идентификатора, отличный от наименования символа. Одному символу Юникода формально можно назначить множество псевдонимов.
Пространство наименований (Namespace) — набор наименований символов совместно с правилами сопоставления наименований. Все наименования символов уникальные в пределах пространства наименований.
Глиф символа
Глиф — визуальная форма представления абстрактного символа на носителе.
Стандарт Юникода не определяет изображение глифа. Он определяет значение символа, то как человек интерпретирует и понимает символ. Внешний вид глифа, форму, размер, размещение на экране определяет устройство визуализации и шрифт.
Носитель не имеет значения ни для символа, ни для глифа. В качестве носителя может выступать глина, пергамент, бумага, электронные устройства или нечто в будущем. Смена носителя не приводит к смене глифа и символа.
Идентификатор кодовой точки
Идентификатор кодовой точки Юникода записывают в шестнадцатеричной системе счисления. Вначале приводят комбинацию «U+», а далее от 4 до 6 цифр. Например, идентификатор «U+044F» присвоен кириллической букве «я».
Подробнее о кодовых точках изложено в разделе кодирование символов.