Плоскость (Юникод) — Википедия
Материал из Википедии — свободной энциклопедии
В стандарте Юникод плоскость — непрерывный диапазон из 65 536 (216) кодовых позиций. Существует 17 плоскостей, обозначенных числами от 0 до 16, что соответствует возможным значениям 00—1016 первым двум шестнадцатеричным цифрам в шестизначном формате номера кодовой позиции (U+hhhhhh). Последняя кодовая позиция в Юникоде — последняя кодовая позиция в плоскости 16, U+10FFFF. Плоскость 0 называется Основная многоязычная плоскость (англ. Basic Multilingual Plane, BMP), которая содержит наиболее часто используемые символы. Остальные плоскости (1—16) называются «дополнительными»[1]. В версии Юникода 12.1 задействованы кодовые позиции шести плоскостей, при этом две из них предназначены для частного использования.
Ограничение в 17 плоскостей обусловлено кодировкой UTF-16, в которой могли быть закодированы 220 кодовых позиций (16 плоскостей) и BMP[2]
Плоскости Юникода:
- Плоскость 0 (0000—FFFF): Основная многоязычная плоскость (англ. Basic Multilingual Plane, BMP)
- Плоскость 1 (10000—1FFFF): Дополнительная многоязычная плоскость (англ. Supplementary Multilingual Plane, SMP)
- Плоскость 2 (20000—2FFFF): Дополнительная идеографическая плоскость (англ. Supplementary Ideographic Plane, SIP)
- Плоскость 3 (30000—3FFFF): Третичная идеографическая плоскость (англ. Tertiary Ideographic Plane, TIP)[4]
- Плоскости 4—13 (40000—DFFFF) не используются
- Плоскость 14 (E0000—EFFFF): Специализированная дополнительная плоскость (англ. Supplementary Special-purpose Plane, SSP)
- Плоскость 15 (F0000—FFFFF) Дополнительная область для частного использования — A (англ. Supplementary Private Use Area-A, SPUA-A)
- Плоскость 16 (100000—10FFFF) Дополнительная область для частного использования — B (англ. Supplementary Private Use Area-B, SPUA-B)
Плоскость 0 (Основная многоязычная плоскость, англ. Basic Multilingual Plane, BMP) отведена для символов практически всех современных письменностей и большого числа специальных символов. Большая часть таблицы занята китайско-японскими иероглифами и своеобразными корейскими буквами.
В Юникоде 12.1 в этой плоскости представлены следующие блоки:
Дополнительная многоязычная плоскость[править | править код]
Плоскость 1 (Дополнительная многоязыковая плоскость, англ. Supplementary Multilingual Plane, SMP) отведена преимущественно для исторических письменностей, но включает также символы условных обозначений, такие как музыкальные и математические символы.
В Юникоде 12.1 в этой плоскости представлены следующие наборы символов:
Дополнительная идеографическая плоскость[править | править код]
Дополнительная идеографическая плоскостьПлоскость 2 (Дополнительная идеографическая плоскость, англ. Supplementary Ideographic Plane, SIP) отведена для редко используемых иероглифов ККЯ.
В Юникоде 12.1 в этой плоскости представлены следующие наборы иероглифов:
Третичная идеографическая плоскость[править | править код]
Плоскость 3 (Третичная идеографическая плоскость, англ. Tertiary Ideographic Plane, TIP) зарезервирована для редко используемых китайских иероглифов, а также для исторических форм китайского письма.
Третичная идеографическая плоскость предварительно разделена на следующие поддиапазоны[5]:
В вышеперечисленные диапазоны предполагается включить следующие наборы иероглифов:
- в диапазон U+30000—U+3134F — дополнительные редко используемые идеограммы китайского письма.
- в диапазон U+31400—U+33D1F — иероглифы в стиле «малая печать» (сяочжуань, 小篆)[6][5].
- в диапазон U+33E00—U+355FF — древнейшие китайские иероглифы эпохи Шан (цзягувэнь, 甲骨文), встречающиеся в гадательных надписях на панцирях, черепах и костях животных[7][5].
В будущем также предполагается включить иероглифы эпох Шан и Чжоу (цзиньвэнь, 金文), встречающиеся в ритуальных надписях на бронзовых сосудах и музыкальных инструментах, и наборы иероглифов Периода Сражающихся царств[5].
Специализированная дополнительная плоскость[править | править код]
Плоскость 14 (Специализированная дополнительная плоскость, англ. Supplementary Special-purpose Plane, SSP) отведена для символов, используемых по особому назначению.
В Юникоде 12.1 в этой плоскости представлены следующие блоки:
Некоторые диапазоны Юникода отведены для частного использования и экспериментов. Они включают:
- Частную область в Базовой многоязыковой плоскости (E000—F8FF)
- Дополнительные плоскости 15 (F0000—U+FFFFF) и 16 (100000—10FFFF)
𓂺 — Египетский иероглиф d053 (U+130BA)
Описание символа
Египетский иероглиф d053. Египетские иероглифы.Кодировка
Кодировка | hex | dec (bytes) | dec | binary |
---|---|---|---|---|
UTF-8 | F0 93 82 BA | 240 147 130 186 | 4036199098 | 11110000 10010011 10000010 10111010 |
UTF-16BE | D8 0C DC BA | 216 12 220 186 | 3624721594 | 11011000 00001100 11011100 10111010 |
UTF-16LE | 0C D8 BA DC | 12 216 186 220 | 215530204 | 00001100 11011000 10111010 11011100 |
UTF-32BE | 00 01 30 BA | 0 1 48 186 | 78010 | 00000000 00000001 00110000 10111010 |
UTF-32LE | BA 30 01 00 | 186 48 1 0 | 3123708160 | 10111010 00110000 00000001 00000000 |
Код | Символ | Название | HTML | |
---|---|---|---|---|
16-чный | 10-чный | |||
U+0400 | Ѐ | cyrillic capital letter ie with grave | Ѐ | Ѐ |
U+0401 | Ё | cyrillic capital letter io | Ё | Ё |
U+0402 | Ђ | cyrillic capital letter dje | Ђ | Ђ |
U+0403 | Ѓ | cyrillic capital letter gje | Ѓ | Ѓ |
U+0404 | Є | cyrillic capital letter ukrainian ie | Є | Є |
U+0405 | Ѕ | cyrillic capital letter dze | Ѕ | Ѕ |
U+0406 | І | cyrillic capital letter byelorussian-ukrainian i | І | І |
U+0407 | Ї | cyrillic capital letter yi | Ї | Ї |
U+0408 | Ј | cyrillic capital letter je | Ј | Ј |
U+0409 | Љ | cyrillic capital letter lje | Љ | Љ |
U+040A | Њ | cyrillic capital letter nje | Њ | Њ |
U+040B | Ћ | cyrillic capital letter tshe | Ћ | Ћ |
U+040C | Ќ | cyrillic capital letter kje | Ќ | Ќ |
U+040D | Ѝ | cyrillic capital letter i with grave | Ѝ | Ѝ |
U+040E | Ў | cyrillic capital letter short u | Ў | Ў |
U+040F | Џ | cyrillic capital letter dzhe | Џ | Џ |
U+0410 | А | cyrillic capital letter a | А | А |
U+0411 | Б | cyrillic capital letter be | Б | Б |
U+0412 | В | cyrillic capital letter ve | В | В |
U+0413 | Г | cyrillic capital letter ghe | Г | Г |
U+0414 | Д | cyrillic capital letter de | Д | Д |
U+0415 | Е | cyrillic capital letter ie | Е | Е |
U+0416 | Ж | cyrillic capital letter zhe | Ж | Ж |
U+0417 | З | cyrillic capital letter ze | З | З |
U+0418 | И | cyrillic capital letter i | И | И |
U+0419 | Й | cyrillic capital letter short i | Й | Й |
U+041A | К | cyrillic capital letter ka | К | К |
U+041B | Л | cyrillic capital letter el | Л | Л |
U+041C | М | cyrillic capital letter em | М | М |
U+041D | Н | cyrillic capital letter en | Н | Н |
U+041E | О | cyrillic capital letter o | О | О |
U+041F | П | cyrillic capital letter pe | П | П |
U+0420 | Р | cyrillic capital letter er | Р | Р |
U+0421 | С | cyrillic capital letter es | С | С |
U+0422 | Т | cyrillic capital letter te | Т | Т |
U+0423 | У | cyrillic capital letter u | У | У |
U+0424 | Ф | cyrillic capital letter ef | Ф | Ф |
U+0425 | Х | cyrillic capital letter ha | Х | Х |
U+0426 | Ц | cyrillic capital letter tse | Ц | Ц |
U+0427 | Ч | cyrillic capital letter che | Ч | Ч |
U+0428 | Ш | cyrillic capital letter sha | Ш | Ш |
U+0429 | Щ | cyrillic capital letter shcha | Щ | Щ |
U+042A | Ъ | cyrillic capital letter hard sign | Ъ | Ъ |
U+042B | Ы | cyrillic capital letter yeru | Ы | Ы |
U+042C | Ь | cyrillic capital letter soft sign | Ь | Ь |
U+042D | Э | cyrillic capital letter e | Э | Э |
U+042E | Ю | cyrillic capital letter yu | Ю | Ю |
U+042F | Я | cyrillic capital letter ya | Я | Я |
U+0430 | а | cyrillic small letter a | а | а |
U+0431 | б | cyrillic small letter be | б | б |
U+0432 | в | cyrillic small letter ve | в | в |
U+0433 | г | cyrillic small letter ghe | г | г |
U+0434 | д | cyrillic small letter de | д | д |
U+0435 | е | cyrillic small letter ie | е | е |
U+0436 | ж | cyrillic small letter zhe | ж | ж |
U+0437 | з | cyrillic small letter ze | з | з |
U+0438 | и | cyrillic small letter i | и | и |
U+0439 | й | cyrillic small letter short i | й | й |
U+043A | к | cyrillic small letter ka | к | к |
U+043B | л | cyrillic small letter el | л | л |
U+043C | м | cyrillic small letter em | м | м |
U+043D | н | cyrillic small letter en | н | н |
U+043E | о | cyrillic small letter o | о | о |
U+043F | п | cyrillic small letter pe | п | п |
U+0440 | р | cyrillic small letter er | р | р |
U+0441 | с | cyrillic small letter es | с | с |
U+0442 | т | cyrillic small letter te | т | т |
U+0443 | у | cyrillic small letter u | у | у |
U+0444 | ф | cyrillic small letter ef | ф | ф |
U+0445 | х | cyrillic small letter ha | х | х |
U+0446 | ц | cyrillic small letter tse | ц | ц |
U+0447 | ч | cyrillic small letter che | ч | ч |
U+0448 | ш | cyrillic small letter sha | ш | ш |
U+0449 | щ | cyrillic small letter shcha | щ | щ |
U+044A | ъ | cyrillic small letter hard sign | ъ | ъ |
U+044B | ы | cyrillic small letter yeru | ы | ы |
U+044C | ь | cyrillic small letter soft sign | ь | ь |
U+044D | э | cyrillic small letter e | э | э |
U+044E | ю | cyrillic small letter yu | ю | ю |
U+044F | я | cyrillic small letter ya | я | я |
U+0450 | ѐ | cyrillic small letter ie with grave | ѐ | ѐ |
U+0451 | ё | cyrillic small letter io | ё | ё |
U+0452 | ђ | cyrillic small letter dje | ђ | ђ |
U+0453 | ѓ | cyrillic small letter gje | ѓ | ѓ |
U+0454 | є | cyrillic small letter ukrainian ie | є | є |
U+0455 | ѕ | cyrillic small letter dze | ѕ | ѕ |
U+0456 | і | cyrillic small letter byelorussian-ukrainian i | і | і |
U+0457 | ї | cyrillic small letter yi | ї | ї |
U+0458 | ј | cyrillic small letter je | ј | ј |
U+0459 | љ | cyrillic small letter lje | љ | љ |
U+045A | њ | cyrillic small letter nje | њ | њ |
U+045B | ћ | cyrillic small letter tshe | ћ | ћ |
U+045C | ќ | cyrillic small letter kje | ќ | ќ |
U+045D | ѝ | cyrillic small letter i with grave | ѝ | ѝ |
U+045E | ў | cyrillic small letter short u | ў | ў |
U+045F | џ | cyrillic small letter dzhe | џ | џ |
U+0460 | Ѡ | cyrillic capital letter omega | Ѡ | Ѡ |
U+0461 | ѡ | cyrillic small letter omega | ѡ | ѡ |
U+0462 | Ѣ | cyrillic capital letter yat | Ѣ | Ѣ |
U+0463 | ѣ | cyrillic small letter yat | ѣ | ѣ |
U+0464 | Ѥ | cyrillic capital letter iotified e | Ѥ | Ѥ |
U+0465 | ѥ | cyrillic small letter iotified e | ѥ | ѥ |
U+0466 | Ѧ | cyrillic capital letter little yus | Ѧ | Ѧ |
U+0467 | ѧ | cyrillic small letter little yus | ѧ | ѧ |
U+0468 | Ѩ | cyrillic capital letter iotified little yus | Ѩ | Ѩ |
U+0469 | ѩ | cyrillic small letter iotified little yus | ѩ | ѩ |
U+046A | Ѫ | cyrillic capital letter big yus | Ѫ | Ѫ |
U+046B | ѫ | cyrillic small letter big yus | ѫ | ѫ |
U+046C | Ѭ | cyrillic capital letter iotified big yus | Ѭ | Ѭ |
U+046D | ѭ | cyrillic small letter iotified big yus | ѭ | ѭ |
U+046E | Ѯ | cyrillic capital letter ksi | Ѯ | Ѯ |
U+046F | ѯ | cyrillic small letter ksi | ѯ | ѯ |
U+0470 | Ѱ | cyrillic capital letter psi | Ѱ | Ѱ |
U+0471 | ѱ | cyrillic small letter psi | ѱ | ѱ |
U+0472 | Ѳ | cyrillic capital letter fita | Ѳ | Ѳ |
U+0473 | ѳ | cyrillic small letter fita | ѳ | ѳ |
U+0474 | Ѵ | cyrillic capital letter izhitsa | Ѵ | Ѵ |
U+0475 | ѵ | cyrillic small letter izhitsa | ѵ | ѵ |
U+0476 | Ѷ | cyrillic capital letter izhitsa with double grave accent | Ѷ | Ѷ |
U+0477 | ѷ | cyrillic small letter izhitsa with double grave accent | ѷ | ѷ |
U+0478 | Ѹ | cyrillic capital letter uk | Ѹ | Ѹ |
U+0479 | ѹ | cyrillic small letter uk | ѹ | ѹ |
U+047A | Ѻ | cyrillic capital letter round omega | Ѻ | Ѻ |
U+047B | ѻ | cyrillic small letter round omega | ѻ | ѻ |
U+047C | Ѽ | cyrillic capital letter omega with titlo | Ѽ | Ѽ |
U+047D | ѽ | cyrillic small letter omega with titlo | ѽ | ѽ |
U+047E | Ѿ | cyrillic capital letter ot | Ѿ | Ѿ |
U+047F | ѿ | cyrillic small letter ot | ѿ | ѿ |
U+0480 | Ҁ | cyrillic capital letter koppa | Ҁ | Ҁ |
U+0481 | ҁ | cyrillic small letter koppa | ҁ | ҁ |
U+0482 | ҂ | cyrillic thousands sign | ҂ | ҂ |
U+0483 | а҃ | combining cyrillic titlo | ҃ | ҃ |
U+0484 | а҄ | combining cyrillic palatalization | ҄ | ҄ |
U+0485 | а҅ | combining cyrillic dasia pneumata | ҅ | ҅ |
U+0486 | а҆ | combining cyrillic psili pneumata | ҆ | ҆ |
U+0487 | а҇ | combining cyrillic pokrytie | ҇ | ҇ |
U+0488 | а҈ | combining cyrillic hundred thousands sign | ҈ | ҈ |
U+0489 | а҉ | combining cyrillic millions sign | ҉ | ҉ |
U+048A | Ҋ | cyrillic capital letter short i with tail | Ҋ | Ҋ |
U+048B | ҋ | cyrillic small letter short i with tail | ҋ | ҋ |
U+048C | Ҍ | cyrillic capital letter semisoft sign | Ҍ | Ҍ |
U+048D | ҍ | cyrillic small letter semisoft sign | ҍ | ҍ |
U+048E | Ҏ | cyrillic capital letter er with tick | Ҏ | Ҏ |
U+048F | ҏ | cyrillic small letter er with tick | ҏ | ҏ |
U+0490 | Ґ | cyrillic capital letter ghe with upturn | Ґ | Ґ |
U+0491 | ґ | cyrillic small letter ghe with upturn | ґ | ґ |
U+0492 | Ғ | cyrillic capital letter ghe with stroke | Ғ | Ғ |
U+0493 | ғ | cyrillic small letter ghe with stroke | ғ | ғ |
U+0494 | Ҕ | cyrillic capital letter ghe with middle hook | Ҕ | Ҕ |
U+0495 | ҕ | cyrillic small letter ghe with middle hook | ҕ | ҕ |
U+0496 | Җ | cyrillic capital letter zhe with descender | Җ | Җ |
U+0497 | җ | cyrillic small letter zhe with descender | җ | җ |
U+0498 | Ҙ | cyrillic capital letter ze with descender | Ҙ | Ҙ |
U+0499 | ҙ | cyrillic small letter ze with descender | ҙ | ҙ |
U+049A | Қ | cyrillic capital letter ka with descender | Қ | Қ |
U+049B | қ | cyrillic small letter ka with descender | қ | қ |
U+049C | Ҝ | cyrillic capital letter ka with vertical stroke | Ҝ | Ҝ |
U+049D | ҝ | cyrillic small letter ka with vertical stroke | ҝ | ҝ |
U+049E | Ҟ | cyrillic capital letter ka with stroke | Ҟ | Ҟ |
U+049F | ҟ | cyrillic small letter ka with stroke | ҟ | ҟ |
U+04A0 | Ҡ | cyrillic capital letter bashkir ka | Ҡ | Ҡ |
U+04A1 | ҡ | cyrillic small letter bashkir ka | ҡ | ҡ |
U+04A2 | Ң | cyrillic capital letter en with descender | Ң | Ң |
U+04A3 | ң | cyrillic small letter en with descender | ң | ң |
U+04A4 | Ҥ | cyrillic capital ligature en ghe | Ҥ | Ҥ |
U+04A5 | ҥ | cyrillic small ligature en ghe | ҥ | ҥ |
U+04A6 | Ҧ | cyrillic capital letter p with middle hook | Ҧ | Ҧ |
U+04A7 | ҧ | cyrillic small letter p with middle hook | ҧ | ҧ |
U+04A8 | Ҩ | cyrillic capital letter abkhasian ha | Ҩ | Ҩ |
U+04A9 | ҩ | cyrillic small letter abkhasian ha | ҩ | ҩ |
U+04AA | Ҫ | cyrillic capital letter es with descender | Ҫ | Ҫ |
U+04AB | ҫ | cyrillic small letter es with descender | ҫ | ҫ |
U+04AC | Ҭ | cyrillic capital letter te with descender | Ҭ | Ҭ |
U+04AD | ҭ | cyrillic small letter te with descender | ҭ | ҭ |
U+04AE | Ү | cyrillic capital letter straight u | Ү | Ү |
U+04AF | ү | cyrillic small letter straight u | ү | ү |
U+04B0 | Ұ | cyrillic capital letter straight u with stroke | Ұ | Ұ |
U+04B1 | ұ | cyrillic small letter straight u with stroke | ұ | ұ |
U+04B2 | Ҳ | cyrillic capital letter ha with descender | Ҳ | Ҳ |
U+04B3 | ҳ | cyrillic small letter ha with descender | ҳ | ҳ |
U+04B4 | Ҵ | cyrillic capital ligature te tse | Ҵ | Ҵ |
U+04B5 | ҵ | cyrillic small ligature te tse | ҵ | ҵ |
U+04B6 | Ҷ | cyrillic capital letter che with descender | Ҷ | Ҷ |
U+04B7 | ҷ | cyrillic small letter che with descender | ҷ | ҷ |
U+04B8 | Ҹ | cyrillic capital letter che with vertical stroke | Ҹ | Ҹ |
U+04B9 | ҹ | cyrillic small letter che with vertical stroke | ҹ | ҹ |
U+04BA | Һ | cyrillic capital letter shha | Һ | Һ |
U+04BB | һ | cyrillic small letter shha | һ | һ |
U+04BC | Ҽ | cyrillic capital letter abkhasian che | Ҽ | Ҽ |
U+04BD | ҽ | cyrillic small letter abkhasian che | ҽ | ҽ |
U+04BE | Ҿ | cyrillic capital letter abkhasian che with descender | Ҿ | Ҿ |
U+04BF | ҿ | cyrillic small letter abkhasian che with descender | ҿ | ҿ |
U+04C0 | Ӏ | cyrillic letter palochka | Ӏ | Ӏ |
U+04C1 | Ӂ | cyrillic capital letter zhe with breve | Ӂ | Ӂ |
U+04C2 | ӂ | cyrillic small letter zhe with breve | ӂ | ӂ |
U+04C3 | Ӄ | cyrillic capital letter ka with hook | Ӄ | Ӄ |
U+04C4 | ӄ | cyrillic small letter ka with hook | ӄ | ӄ |
U+04C5 | Ӆ | cyrillic capital letter el with tail | Ӆ | Ӆ |
U+04C6 | ӆ | cyrillic small letter el with tail | ӆ | ӆ |
U+04C7 | Ӈ | cyrillic capital letter en with hook | Ӈ | Ӈ |
U+04C8 | ӈ | cyrillic small letter en with hook | ӈ | ӈ |
U+04C9 | Ӊ | cyrillic capital letter en with tail | Ӊ | Ӊ |
U+04CA | ӊ | cyrillic small letter en with tail | ӊ | ӊ |
U+04CB | Ӌ | cyrillic capital letter khakassian che | Ӌ | Ӌ |
U+04CC | ӌ | cyrillic small letter khakassian che | ӌ | ӌ |
U+04CD | Ӎ | cyrillic capital letter em with tail | Ӎ | Ӎ |
U+04CE | ӎ |
́ — Комбинируемый акут (лёгкое ударение) (U+0301)
Описание символа
Комбинируемый акут (лёгкое ударение). Комбинируемые диакритические знаки.
Кодировка
Кодировка | hex | dec (bytes) | dec | binary |
---|---|---|---|---|
UTF-8 | CC 81 | 204 129 | 52353 | 11001100 10000001 |
UTF-16BE | 03 01 | 3 1 | 769 | 00000011 00000001 |
UTF-16LE | 01 03 | 1 3 | 259 | 00000001 00000011 |
UTF-32BE | 00 00 03 01 | 0 0 3 1 | 769 | 00000000 00000000 00000011 00000001 |
UTF-32LE | 01 03 00 00 | 1 3 0 0 | 16973824 | 00000001 00000011 00000000 00000000 |