U символ: Разделы Юникода — Таблица символов Юникода® – Таблица символов Юникода (Unicode) — Хитрые инструменты

Плоскость (Юникод) — Википедия

Материал из Википедии — свободной энциклопедии

В стандарте Юникод плоскость — непрерывный диапазон из 65 536 (216) кодовых позиций. Существует 17 плоскостей, обозначенных числами от 0 до 16, что соответствует возможным значениям 00—1016 первым двум шестнадцатеричным цифрам в шестизначном формате номера кодовой позиции (U+hhhhhh). Последняя кодовая позиция в Юникоде — последняя кодовая позиция в плоскости 16, U+10FFFF. Плоскость 0 называется Основная многоязычная плоскость (англ. Basic Multilingual Plane, BMP), которая содержит наиболее часто используемые символы. Остальные плоскости (1—16) называются «дополнительными»[1]. В версии Юникода 12.1 задействованы кодовые позиции шести плоскостей, при этом две из них предназначены для частного использования.

Ограничение в 17 плоскостей обусловлено кодировкой UTF-16, в которой могли быть закодированы 220 кодовых позиций (16 плоскостей) и BMP[2]. Кодировка UTF-8 была разработана с гораздо большим лимитом в 231 (2 147 483 648) кодовых позиций (32 768 плоскостей) и могла задействовать 221

(2 097 152) кодовых позиций (32 плоскости) даже при лимите 4 байта[3].

Плоскости Юникода:

  • Плоскость 0 (0000—FFFF): Основная многоязычная плоскость (англ. Basic Multilingual Plane, BMP)
  • Плоскость 1 (10000—1FFFF): Дополнительная многоязычная плоскость (англ. Supplementary Multilingual Plane, SMP)
  • Плоскость 2 (20000—2FFFF): Дополнительная идеографическая плоскость (англ. Supplementary Ideographic Plane, SIP)
  • Плоскость 3 (30000—3FFFF): Третичная идеографическая плоскость (англ. Tertiary Ideographic Plane, TIP)[4]
  • Плоскости 4—13 (40000—DFFFF) не используются
  • Плоскость 14 (E0000—EFFFF): Специализированная дополнительная плоскость (англ. Supplementary Special-purpose Plane, SSP)
  • Плоскость 15 (F0000—FFFFF) Дополнительная область для частного использования — A (англ. Supplementary Private Use Area-A, SPUA-A)
  • Плоскость 16 (100000—10FFFF) Дополнительная область для частного использования — B (англ. Supplementary Private Use Area-B, SPUA-B)
Основная многоязычная плоскость

Плоскость 0 (Основная многоязычная плоскость, англ. Basic Multilingual Plane, BMP) отведена для символов практически всех современных письменностей и большого числа специальных символов. Большая часть таблицы занята китайско-японскими иероглифами и своеобразными корейскими буквами.

В Юникоде 12.1 в этой плоскости представлены следующие блоки:

Дополнительная многоязычная плоскость[править | править код]

Дополнительная многоязыковая плоскость

Плоскость 1 (Дополнительная многоязыковая плоскость, англ. Supplementary Multilingual Plane, SMP) отведена преимущественно для исторических письменностей, но включает также символы условных обозначений, такие как музыкальные и математические символы.

В Юникоде 12.1 в этой плоскости представлены следующие наборы символов:

Дополнительная идеографическая плоскость[править | править код]

Дополнительная идеографическая плоскость

Плоскость 2 (Дополнительная идеографическая плоскость, англ. Supplementary Ideographic Plane, SIP) отведена для редко используемых иероглифов ККЯ.

В Юникоде 12.1 в этой плоскости представлены следующие наборы иероглифов:

Третичная идеографическая плоскость[править | править код]

Плоскость 3 (Третичная идеографическая плоскость, англ. Tertiary Ideographic Plane, TIP) зарезервирована для редко используемых китайских иероглифов, а также для исторических форм китайского письма.

Третичная идеографическая плоскость предварительно разделена на следующие поддиапазоны[5]:

В вышеперечисленные диапазоны предполагается включить следующие наборы иероглифов:

  • в диапазон U+30000—U+3134F - дополнительные редко используемые идеограммы китайского письма.
  • в диапазон U+31400—U+33D1F — иероглифы в стиле «малая печать» (сяочжуань, 小篆)[6][5].
  • в диапазон U+33E00—U+355FF — древнейшие китайские иероглифы эпохи Шан (цзягувэнь, 甲骨文), встречающиеся в гадательных надписях на панцирях, черепах и костях животных
    [7]
    [5].

В будущем также предполагается включить иероглифы эпох Шан и Чжоу (цзиньвэнь, 金文), встречающиеся в ритуальных надписях на бронзовых сосудах и музыкальных инструментах, и наборы иероглифов Периода Сражающихся царств[5].

Специализированная дополнительная плоскость[править | править код]

Специализированная дополнительная плоскость

Плоскость 14 (Специализированная дополнительная плоскость, англ. Supplementary Special-purpose Plane, SSP) отведена для символов, используемых по особому назначению.

В Юникоде 12.1 в этой плоскости представлены следующие блоки:

Некоторые диапазоны Юникода отведены для частного использования и экспериментов. Они включают:

  • Частную область в Базовой многоязыковой плоскости (E000—F8FF)
  • Дополнительные плоскости 15 (F0000—U+FFFFF) и 16 (100000—10FFFF)

𓂺 - Египетский иероглиф d053 (U+130BA)

Описание символа

Египетский иероглиф d053. Египетские иероглифы.

Кодировка

Кодировка hex dec (bytes) dec binary
UTF-8 F0 93 82 BA 240 147 130 186 4036199098 11110000 10010011 10000010 10111010
UTF-16BE D8 0C DC BA 216 12 220 186 3624721594 11011000 00001100 11011100 10111010
UTF-16LE 0C D8 BA DC 12 216 186 220 215530204 00001100 11011000 10111010 11011100
UTF-32BE
00 01 30 BA
0 1 48 186 78010 00000000 00000001 00110000 10111010
UTF-32LE BA 30 01 00 186 48 1 0 3123708160 10111010 00110000 00000001 00000000

Кириллица (блок Юникода) — Википедия

Код Символ Название HTML
16-чный 10-чный
U+0400 Ѐ cyrillic capital letter ie with grave Ѐ Ѐ
U+0401 Ё cyrillic capital letter io Ё Ё
U+0402 Ђ cyrillic capital letter dje Ђ Ђ
U+0403 Ѓ cyrillic capital letter gje Ѓ Ѓ
U+0404 Є cyrillic capital letter ukrainian ie Є Є
U+0405 Ѕ cyrillic capital letter dze Ѕ Ѕ
U+0406 І cyrillic capital letter byelorussian-ukrainian i І І
U+0407 Ї cyrillic capital letter yi Ї Ї
U+0408 Ј cyrillic capital letter je Ј Ј
U+0409 Љ cyrillic capital letter lje Љ Љ
U+040A Њ cyrillic capital letter nje Њ Њ
U+040B Ћ cyrillic capital letter tshe Ћ Ћ
U+040C Ќ cyrillic capital letter kje Ќ Ќ
U+040D Ѝ cyrillic capital letter i with grave Ѝ Ѝ
U+040E Ў cyrillic capital letter short u Ў Ў
U+040F Џ cyrillic capital letter dzhe Џ Џ
U+0410 А cyrillic capital letter a А А
U+0411 Б cyrillic capital letter be Б Б
U+0412 В cyrillic capital letter ve В В
U+0413 Г cyrillic capital letter ghe Г Г
U+0414 Д cyrillic capital letter de Д Д
U+0415 Е cyrillic capital letter ie Е Е
U+0416 Ж cyrillic capital letter zhe Ж Ж
U+0417 З cyrillic capital letter ze З З
U+0418 И cyrillic capital letter i И И
U+0419 Й cyrillic capital letter short i Й Й
U+041A К cyrillic capital letter ka К К
U+041B Л cyrillic capital letter el Л Л
U+041C М cyrillic capital letter em М М
U+041D Н cyrillic capital letter en Н Н
U+041E О cyrillic capital letter o О О
U+041F П cyrillic capital letter pe П П
U+0420 Р cyrillic capital letter er Р Р
U+0421 С cyrillic capital letter es С С
U+0422 Т cyrillic capital letter te Т Т
U+0423 У cyrillic capital letter u У У
U+0424 Ф cyrillic capital letter ef Ф Ф
U+0425 Х cyrillic capital letter ha Х Х
U+0426 Ц cyrillic capital letter tse Ц Ц
U+0427 Ч cyrillic capital letter che Ч Ч
U+0428 Ш cyrillic capital letter sha Ш Ш
U+0429 Щ cyrillic capital letter shcha Щ Щ
U+042A Ъ cyrillic capital letter hard sign Ъ Ъ
U+042B Ы cyrillic capital letter yeru Ы Ы
U+042C Ь cyrillic capital letter soft sign Ь Ь
U+042D Э cyrillic capital letter e Э Э
U+042E Ю cyrillic capital letter yu Ю Ю
U+042F Я cyrillic capital letter ya Я Я
U+0430 а cyrillic small letter a а а
U+0431 б cyrillic small letter be б б
U+0432 в cyrillic small letter ve в в
U+0433 г cyrillic small letter ghe г г
U+0434 д cyrillic small letter de д д
U+0435 е cyrillic small letter ie е е
U+0436 ж cyrillic small letter zhe ж ж
U+0437 з cyrillic small letter ze з з
U+0438 и cyrillic small letter i и и
U+0439 й cyrillic small letter short i й й
U+043A к cyrillic small letter ka к к
U+043B л cyrillic small letter el л л
U+043C м cyrillic small letter em м м
U+043D н cyrillic small letter en н н
U+043E о cyrillic small letter o о о
U+043F п cyrillic small letter pe п п
U+0440 р cyrillic small letter er р р
U+0441 с cyrillic small letter es с с
U+0442 т cyrillic small letter te т т
U+0443 у cyrillic small letter u у у
U+0444 ф cyrillic small letter ef ф ф
U+0445 х cyrillic small letter ha х х
U+0446 ц cyrillic small letter tse ц ц
U+0447 ч cyrillic small letter che ч ч
U+0448 ш cyrillic small letter sha ш ш
U+0449 щ cyrillic small letter shcha щ щ
U+044A ъ cyrillic small letter hard sign ъ ъ
U+044B ы cyrillic small letter yeru ы ы
U+044C ь cyrillic small letter soft sign ь ь
U+044D э cyrillic small letter e э э
U+044E ю cyrillic small letter yu ю ю
U+044F я cyrillic small letter ya я я
U+0450 ѐ cyrillic small letter ie with grave ѐ ѐ
U+0451 ё cyrillic small letter io ё ё
U+0452 ђ cyrillic small letter dje ђ ђ
U+0453 ѓ cyrillic small letter gje ѓ ѓ
U+0454 є cyrillic small letter ukrainian ie є є
U+0455 ѕ cyrillic small letter dze ѕ ѕ
U+0456 і cyrillic small letter byelorussian-ukrainian i і і
U+0457 ї cyrillic small letter yi ї ї
U+0458 ј cyrillic small letter je ј ј
U+0459 љ cyrillic small letter lje љ љ
U+045A њ cyrillic small letter nje њ њ
U+045B ћ cyrillic small letter tshe ћ ћ
U+045C ќ cyrillic small letter kje ќ ќ
U+045D ѝ cyrillic small letter i with grave ѝ ѝ
U+045E ў cyrillic small letter short u ў ў
U+045F џ cyrillic small letter dzhe џ џ
U+0460 Ѡ cyrillic capital letter omega Ѡ Ѡ
U+0461 ѡ cyrillic small letter omega ѡ ѡ
U+0462 Ѣ cyrillic capital letter yat Ѣ Ѣ
U+0463 ѣ cyrillic small letter yat ѣ ѣ
U+0464 Ѥ cyrillic capital letter iotified e Ѥ Ѥ
U+0465 ѥ cyrillic small letter iotified e ѥ ѥ
U+0466 Ѧ cyrillic capital letter little yus Ѧ Ѧ
U+0467 ѧ cyrillic small letter little yus ѧ ѧ
U+0468 Ѩ cyrillic capital letter iotified little yus Ѩ Ѩ
U+0469 ѩ cyrillic small letter iotified little yus ѩ ѩ
U+046A Ѫ cyrillic capital letter big yus Ѫ Ѫ
U+046B ѫ cyrillic small letter big yus ѫ ѫ
U+046C Ѭ cyrillic capital letter iotified big yus Ѭ Ѭ
U+046D ѭ cyrillic small letter iotified big yus ѭ ѭ
U+046E Ѯ cyrillic capital letter ksi Ѯ Ѯ
U+046F ѯ cyrillic small letter ksi ѯ ѯ
U+0470 Ѱ cyrillic capital letter psi Ѱ Ѱ
U+0471 ѱ cyrillic small letter psi ѱ ѱ
U+0472 Ѳ cyrillic capital letter fita Ѳ Ѳ
U+0473 ѳ cyrillic small letter fita ѳ ѳ
U+0474 Ѵ cyrillic capital letter izhitsa Ѵ Ѵ
U+0475 ѵ cyrillic small letter izhitsa ѵ ѵ
U+0476 Ѷ cyrillic capital letter izhitsa with double grave accent Ѷ Ѷ
U+0477 ѷ cyrillic small letter izhitsa with double grave accent ѷ ѷ
U+0478 Ѹ cyrillic capital letter uk Ѹ Ѹ
U+0479 ѹ cyrillic small letter uk ѹ ѹ
U+047A Ѻ cyrillic capital letter round omega Ѻ Ѻ
U+047B ѻ cyrillic small letter round omega ѻ ѻ
U+047C Ѽ cyrillic capital letter omega with titlo Ѽ Ѽ
U+047D ѽ cyrillic small letter omega with titlo ѽ ѽ
U+047E Ѿ cyrillic capital letter ot Ѿ Ѿ
U+047F ѿ cyrillic small letter ot ѿ ѿ
U+0480 Ҁ cyrillic capital letter koppa Ҁ Ҁ
U+0481 ҁ cyrillic small letter koppa ҁ ҁ
U+0482 ҂ cyrillic thousands sign ҂ ҂
U+0483 а҃ combining cyrillic titlo ҃ ҃
U+0484 а҄ combining cyrillic palatalization ҄ ҄
U+0485 а҅ combining cyrillic dasia pneumata ҅ ҅
U+0486 а҆ combining cyrillic psili pneumata ҆ ҆
U+0487 а҇ combining cyrillic pokrytie ҇ ҇
U+0488 а҈ combining cyrillic hundred thousands sign ҈ ҈
U+0489 а҉ combining cyrillic millions sign ҉ ҉
U+048A Ҋ cyrillic capital letter short i with tail Ҋ Ҋ
U+048B ҋ cyrillic small letter short i with tail ҋ ҋ
U+048C Ҍ cyrillic capital letter semisoft sign Ҍ Ҍ
U+048D ҍ cyrillic small letter semisoft sign ҍ ҍ
U+048E Ҏ cyrillic capital letter er with tick Ҏ Ҏ
U+048F ҏ cyrillic small letter er with tick ҏ ҏ
U+0490 Ґ cyrillic capital letter ghe with upturn Ґ Ґ
U+0491 ґ cyrillic small letter ghe with upturn ґ ґ
U+0492 Ғ cyrillic capital letter ghe with stroke Ғ Ғ
U+0493 ғ cyrillic small letter ghe with stroke ғ ғ
U+0494 Ҕ cyrillic capital letter ghe with middle hook Ҕ Ҕ
U+0495 ҕ cyrillic small letter ghe with middle hook ҕ ҕ
U+0496 Җ cyrillic capital letter zhe with descender Җ Җ
U+0497 җ cyrillic small letter zhe with descender җ җ
U+0498 Ҙ cyrillic capital letter ze with descender Ҙ Ҙ
U+0499 ҙ cyrillic small letter ze with descender ҙ ҙ
U+049A Қ cyrillic capital letter ka with descender Қ Қ
U+049B қ cyrillic small letter ka with descender қ қ
U+049C Ҝ cyrillic capital letter ka with vertical stroke Ҝ Ҝ
U+049D ҝ cyrillic small letter ka with vertical stroke ҝ ҝ
U+049E Ҟ cyrillic capital letter ka with stroke Ҟ Ҟ
U+049F ҟ cyrillic small letter ka with stroke ҟ ҟ
U+04A0 Ҡ cyrillic capital letter bashkir ka Ҡ Ҡ
U+04A1 ҡ cyrillic small letter bashkir ka ҡ ҡ
U+04A2 Ң cyrillic capital letter en with descender Ң Ң
U+04A3 ң cyrillic small letter en with descender ң ң
U+04A4 Ҥ cyrillic capital ligature en ghe Ҥ Ҥ
U+04A5 ҥ cyrillic small ligature en ghe ҥ ҥ
U+04A6 Ҧ cyrillic capital letter p with middle hook Ҧ Ҧ
U+04A7 ҧ cyrillic small letter p with middle hook ҧ ҧ
U+04A8 Ҩ cyrillic capital letter abkhasian ha Ҩ Ҩ
U+04A9 ҩ cyrillic small letter abkhasian ha ҩ ҩ
U+04AA Ҫ cyrillic capital letter es with descender Ҫ Ҫ
U+04AB ҫ cyrillic small letter es with descender ҫ ҫ
U+04AC Ҭ cyrillic capital letter te with descender Ҭ Ҭ
U+04AD ҭ cyrillic small letter te with descender ҭ ҭ
U+04AE Ү cyrillic capital letter straight u Ү Ү
U+04AF ү cyrillic small letter straight u ү ү
U+04B0 Ұ cyrillic capital letter straight u with stroke Ұ Ұ
U+04B1 ұ cyrillic small letter straight u with stroke ұ ұ
U+04B2 Ҳ cyrillic capital letter ha with descender Ҳ Ҳ
U+04B3 ҳ cyrillic small letter ha with descender ҳ ҳ
U+04B4 Ҵ cyrillic capital ligature te tse Ҵ Ҵ
U+04B5 ҵ cyrillic small ligature te tse ҵ ҵ
U+04B6 Ҷ cyrillic capital letter che with descender Ҷ Ҷ
U+04B7 ҷ cyrillic small letter che with descender ҷ ҷ
U+04B8 Ҹ cyrillic capital letter che with vertical stroke Ҹ Ҹ
U+04B9 ҹ cyrillic small letter che with vertical stroke ҹ ҹ
U+04BA Һ cyrillic capital letter shha Һ Һ
U+04BB һ cyrillic small letter shha һ һ
U+04BC Ҽ cyrillic capital letter abkhasian che Ҽ Ҽ
U+04BD ҽ cyrillic small letter abkhasian che ҽ ҽ
U+04BE Ҿ cyrillic capital letter abkhasian che with descender Ҿ Ҿ
U+04BF ҿ cyrillic small letter abkhasian che with descender ҿ ҿ
U+04C0 Ӏ cyrillic letter palochka Ӏ Ӏ
U+04C1 Ӂ cyrillic capital letter zhe with breve Ӂ Ӂ
U+04C2 ӂ cyrillic small letter zhe with breve ӂ ӂ
U+04C3 Ӄ cyrillic capital letter ka with hook Ӄ Ӄ
U+04C4 ӄ cyrillic small letter ka with hook ӄ ӄ
U+04C5 Ӆ cyrillic capital letter el with tail Ӆ Ӆ
U+04C6 ӆ cyrillic small letter el with tail ӆ ӆ
U+04C7 Ӈ cyrillic capital letter en with hook Ӈ Ӈ
U+04C8 ӈ cyrillic small letter en with hook ӈ ӈ
U+04C9 Ӊ cyrillic capital letter en with tail Ӊ Ӊ
U+04CA ӊ cyrillic small letter en with tail ӊ ӊ
U+04CB Ӌ cyrillic capital letter khakassian che Ӌ Ӌ
U+04CC ӌ cyrillic small letter khakassian che ӌ ӌ
U+04CD Ӎ cyrillic capital letter em with tail Ӎ Ӎ
U+04CE ӎ

́ - Комбинируемый акут (лёгкое ударение) (U+0301)

Описание символа

Комбинируемый акут (лёгкое ударение). Комбинируемые диакритические знаки.

Кодировка

Кодировка hex dec (bytes) dec binary
UTF-8 CC 81 204 129 52353 11001100 10000001
UTF-16BE 03 01 3 1 769 00000011 00000001
UTF-16LE 01 03 1 3 259 00000001 00000011
UTF-32BE 00 00 03 01 0 0 3 1 769 00000000 00000000 00000011 00000001
UTF-32LE 01 03 00 00 1 3 0 0 16973824 00000001 00000011 00000000 00000000

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *