❗ Вебсайт в стадии бета-тестирования. Возможны ошибки.

Типы символов гипертекста

Введённая в справочнике практическая классификация типов кодовых точек, выделяет всего два типа абстрактных символов: графические символы и символы форматирования гипертекста.

В свою очередь графические символы содержат наборы:

Символы форматирования содержат:

Условные обозначения

В спецификациях с описанием символов применены условные обозначения кодовых точек Юникода, наименования символов и свойств. Дополнительно введена группировка символов по назначению.

Кодовые точки Юникода

В тексте отдельная кодовая точка Юникода обозначена в виде «U+N», где:

  • U+ — это условное обозначение Юникода;
  • N — это шестнадцатеричное число, в котором использованы цифры от 0 до 9 и заглавные буквы латинского алфавита от A до F.

Шестнадцатеричное число N должно содержать не менее 4 знаков. Начальные нули кодовой точки можно опустить, но только до 4 знаков. Например, нельзя опустить начальные нули следующих символов: U+0001, U+0012, U+0123 или кода U+0416 для кириллической буквы «Ж».

Наименование символов и свойств

В описании наименования символов Юникода приведены буквами верхнего регистра латинского алфавита. Например, наименование кириллической буквы «Ж»: CYRILLIC CAPITAL LETTER ZHE.

Наименование свойства символа приведены с заглавной буквы. Слова соединены символом подчёркивания. Например, свойство общей категории General_Category или буква в верхнем регистре Uppercase_Letter.

Группировка по назначению

Внутри спецификаций символов возможно вторичное деление по назначению. Описание символов любого типа содержит:

  • наборы символов, сгруппированные по назначению:
  • коды символов Юникода;
  • мнемоники символов стандарта HTML5;
  • наименование символа в Юникоде.

Применение кодов символов

Коды, приведённые в справочнике, используют следующим образом.

В текст в формате HTML вставляют либо значение кода HTML, либо значение мнемоники HTML. Синопсис записи:

<span>код HTML</span>
или
<span>мнемоника HTML</span>

Пример использования кода валюты евро (€):

<span>&#8364;</span>
или
<span>&euro;</span>

В текст в формате Markdown вставляют коды HTML или мнемонику HTML без какого-либо обрамления тегами. Например,

Текст в формате Markdown, в который вставлен сначала код HTML для валюты евро &#8364;.
А затем мнемоника HTML для валюты евро &euro;.

Коды символов для CSS не приведены, поскольку они производные от кода Юникода. Для получения кода CSS достаточно заменить часть «U+» Юникода на косую черту «\». Например, символ параграфа § имеет кодовую точку «U+00A7». Соответственно, код CSS будет: «\00A7». Полученный таким образом код вставляют в описание стиля CSS. Синопсис записи:

span {
  content: "код CSS";
}

Например для валюты евро (€):

span {
  content: "\20AC";
}