Плоскость Юникода
Распределение символов Юникода
Для удобства кодирования символы Юникода сгруппированы по лингвистическим и функциональным категориям. При этом письменность интерпретируют как одну из функциональных категорий. Например, текст на русском языке (российская письменность) это назначение определённой группы символов.
Плоскости Юникода
Кодовое пространство Юникода разделено на подпространства, называемые плоскости. Каждая плоскость содержит 64 тысячи кодовых точек. Последние четыре шестнадцатеричные цифры в каждой кодовой точке указывают положение символа внутри плоскости. Остальные цифры указывают плоскость.
Плоскость Юникода — непрерывный диапазон из 5 536 (216) кодовых позиций.
Набор символов Юникода разделён на 17 плоскостей. Однако для управления вебсайтами и написания текстов на русском языке полезны всего три:
- основная многоязычная плоскость (Basic Multilingual Plane, BMP), которая содержит в диапазоне от U+0000 до U+FFFF общепринятые символы всех современных письменностей мира;
- дополнительная многоязычная плоскость (Supplementary Multilingual Plane, SMP), которая содержит условные обозначения и математические символы в диапазоне от U+10000 до U+1FFFF;
- дополнительная специальная плоскость (Supplementary Special-purpose Plane, SSP) выделена для символов управления форматом.
Остальные плоскости содержат либо историческую письменность, либо китайские, японские и корейские идеограммы.