Нормативное обоснование справочника
Для понимания сведений данного справочника приведу краткое описание стандарта Юникода (Unicode).
Анализ стандартов управления абстрактными символами позволил сделать следующие выводы:
- Для управления обычным текстом следует применять стандарт Юникода. (Unicode) Стандарт Международной организации стандартизации ISO/IEC 10646:2020 Information technology. Universal coded character set (UCS) можно игнорировать.
- Стандарт Юникода содержит 17 плоскостей символов. Программисту и автору обычных текстов необходимы только две из них:
- основная многоязычная плоскость (Basic Multilingual Plane, BMP);
- дополнительная многоязычная плоскость (Supplementary Multilingual Plane, SMP).
- В каждой плоскости множество блоков. Для инженерии Веба полезны лишь некоторые из блоков.
- Классификация кодовых точек позволила специально для справочника выстроить собственную классификацию.
- При создании вебстраниц в метаданных следует указывать кодировку UTF-8.
- Нормализованная композиция (Normalization Form C, NFC) — это рекомендуемый способ хранения и обмена текстами в Вебе. Для нормализации следует использовать методы и библиотеки языков программирования. Например, при программировании на языке Go используйте библиотеку golang.org/x/text.
Обратите внимание!
Ни один стандарт не определяют пригодность символов в качестве исходных кодов для языков программирования.