U символ: Разделы Юникода — Таблица символов Юникода® – Таблица символов Юникода (Unicode) — Хитрые инструменты

Плоскость (Юникод) — Википедия

Материал из Википедии — свободной энциклопедии

В стандарте Юникод плоскость — непрерывный диапазон из 65 536 (216) кодовых позиций. Существует 17 плоскостей, обозначенных числами от 0 до 16, что соответствует возможным значениям 00—1016 первым двум шестнадцатеричным цифрам в шестизначном формате номера кодовой позиции (U+hhhhhh). Последняя кодовая позиция в Юникоде — последняя кодовая позиция в плоскости 16, U+10FFFF. Плоскость 0 называется Основная многоязычная плоскость (англ. Basic Multilingual Plane, BMP), которая содержит наиболее часто используемые символы. Остальные плоскости (1—16) называются «дополнительными»[1]. В версии Юникода 12.1 задействованы кодовые позиции шести плоскостей, при этом две из них предназначены для частного использования.

Ограничение в 17 плоскостей обусловлено кодировкой UTF-16, в которой могли быть закодированы 220 кодовых позиций (16 плоскостей) и BMP[2]

. Кодировка UTF-8 была разработана с гораздо большим лимитом в 231 (2 147 483 648) кодовых позиций (32 768 плоскостей) и могла задействовать 221 (2 097 152) кодовых позиций (32 плоскости) даже при лимите 4 байта[3].

Плоскости Юникода:

  • Плоскость 0 (0000—FFFF): Основная многоязычная плоскость (англ. Basic Multilingual Plane, BMP)
  • Плоскость 1 (10000—1FFFF): Дополнительная многоязычная плоскость (англ. Supplementary Multilingual Plane, SMP)
  • Плоскость 2 (20000—2FFFF): Дополнительная идеографическая плоскость (англ. Supplementary Ideographic Plane, SIP)
  • Плоскость 3 (30000—3FFFF): Третичная идеографическая плоскость (англ. Tertiary Ideographic Plane, TIP)[4]
  • Плоскости 4—13 (40000—DFFFF) не используются
  • Плоскость 14 (E0000—EFFFF): Специализированная дополнительная плоскость (англ. Supplementary Special-purpose Plane, SSP)
  • Плоскость 15 (F0000—FFFFF)
    Дополнительная область для частного использования — A
    (англ. Supplementary Private Use Area-A, SPUA-A)
  • Плоскость 16 (100000—10FFFF) Дополнительная область для частного использования — B (англ. Supplementary Private Use Area-B, SPUA-B)
Основная многоязычная плоскость

Плоскость 0 (Основная многоязычная плоскость, англ. Basic Multilingual Plane, BMP) отведена для символов практически всех современных письменностей и большого числа специальных символов. Большая часть таблицы занята китайско-японскими иероглифами и своеобразными корейскими буквами.

В Юникоде 12.1 в этой плоскости представлены следующие блоки:

Дополнительная многоязычная плоскость[править | править код]

Дополнительная многоязыковая плоскость

Плоскость 1 (Дополнительная многоязыковая плоскость, англ. Supplementary Multilingual Plane, SMP) отведена преимущественно для исторических письменностей, но включает также символы условных обозначений, такие как музыкальные и математические символы.

В Юникоде 12.1 в этой плоскости представлены следующие наборы символов:

Дополнительная идеографическая плоскость[править | править код]

Дополнительная идеографическая плоскость

Плоскость 2 (Дополнительная идеографическая плоскость, англ. Supplementary Ideographic Plane, SIP) отведена для редко используемых иероглифов ККЯ.

В Юникоде 12.1 в этой плоскости представлены следующие наборы иероглифов:

Третичная идеографическая плоскость[править | править код]

Плоскость 3 (Третичная идеографическая плоскость, англ. Tertiary Ideographic Plane,

TIP) зарезервирована для редко используемых китайских иероглифов, а также для исторических форм китайского письма.

Третичная идеографическая плоскость предварительно разделена на следующие поддиапазоны[5]:

В вышеперечисленные диапазоны предполагается включить следующие наборы иероглифов:

  • в диапазон U+30000—U+3134F — дополнительные редко используемые идеограммы китайского письма.
  • в диапазон U+31400—U+33D1F — иероглифы в стиле «малая печать» (сяочжуань, 小篆)[6][5].
  • в диапазон U+33E00—U+355FF — древнейшие китайские иероглифы эпохи Шан (цзягувэнь, 甲骨文), встречающиеся в гадательных надписях на панцирях, черепах и костях животных[7][5].

В будущем также предполагается включить иероглифы эпох Шан и Чжоу (цзиньвэнь, 金文), встречающиеся в ритуальных надписях на бронзовых сосудах и музыкальных инструментах, и наборы иероглифов Периода Сражающихся царств[5].

Специализированная дополнительная плоскость[править | править код]

Специализированная дополнительная плоскость

Плоскость 14 (Специализированная дополнительная плоскость, англ. Supplementary Special-purpose Plane, SSP) отведена для символов, используемых по особому назначению.

В Юникоде 12.1 в этой плоскости представлены следующие блоки:

Некоторые диапазоны Юникода отведены для частного использования и экспериментов. Они включают:

  • Частную область в Базовой многоязыковой плоскости (E000—F8FF)
  • Дополнительные плоскости 15 (F0000—U+FFFFF) и 16 (100000—10FFFF)

𓂺 — Египетский иероглиф d053 (U+130BA)

Описание символа

Египетский иероглиф d053. Египетские иероглифы.

Кодировка

Кодировкаhexdec (bytes)decbinary
UTF-8F0 93 82 BA240 147 130 186403619909811110000 10010011 10000010 10111010
UTF-16BED8 0C DC BA216 12 220 186362472159411011000 00001100 11011100 10111010
UTF-16LE0C D8 BA DC12 216 186 22021553020400001100 11011000 10111010 11011100
UTF-32BE00 01 30 BA0 1 48 1867801000000000 00000001 00110000 10111010
UTF-32LEBA 30 01 00186 48 1 0312370816010111010 00110000 00000001 00000000

Кириллица (блок Юникода) — Википедия

КодСимволНазваниеHTML
16-чный10-чный
U+0400Ѐcyrillic capital letter ie with graveЀЀ
U+0401Ёcyrillic capital letter ioЁЁ
U+0402Ђcyrillic capital letter djeЂЂ
U+0403Ѓcyrillic capital letter gjeЃЃ
U+0404Єcyrillic capital letter ukrainian ieЄЄ
U+0405Ѕcyrillic capital letter dzeЅЅ
U+0406Іcyrillic capital letter byelorussian-ukrainian iІІ
U+0407Їcyrillic capital letter yiЇЇ
U+0408Јcyrillic capital letter je
Ј
Ј
U+0409Љcyrillic capital letter ljeЉЉ
U+040AЊcyrillic capital letter njeЊЊ
U+040BЋcyrillic capital letter tsheЋЋ
U+040CЌcyrillic capital letter kjeЌЌ
U+040DЍcyrillic capital letter i with graveЍЍ
U+040EЎcyrillic capital letter short uЎЎ
U+040FЏcyrillic capital letter dzheЏЏ
U+0410Аcyrillic capital letter aАА
U+0411Бcyrillic capital letter beББ
U+0412Вcyrillic capital letter veВВ
U+0413Гcyrillic capital letter gheГГ
U+0414Дcyrillic capital letter deДД
U+0415Еcyrillic capital letter ieЕЕ
U+0416Жcyrillic capital letter zheЖЖ
U+0417Зcyrillic capital letter zeЗЗ
U+0418Иcyrillic capital letter iИИ
U+0419Йcyrillic capital letter short iЙЙ
U+041AКcyrillic capital letter kaКК
U+041BЛcyrillic capital letter elЛЛ
U+041CМcyrillic capital letter emММ
U+041DНcyrillic capital letter enНН
U+041EОcyrillic capital letter oОО
U+041FПcyrillic capital letter peПП
U+0420Рcyrillic capital letter erРР
U+0421Сcyrillic capital letter esСС
U+0422Тcyrillic capital letter teТТ
U+0423Уcyrillic capital letter uУУ
U+0424Фcyrillic capital letter efФФ
U+0425Хcyrillic capital letter haХХ
U+0426Цcyrillic capital letter tseЦЦ
U+0427Чcyrillic capital letter cheЧЧ
U+0428Шcyrillic capital letter shaШШ
U+0429Щcyrillic capital letter shchaЩЩ
U+042AЪcyrillic capital letter hard signЪЪ
U+042BЫcyrillic capital letter yeruЫЫ
U+042CЬcyrillic capital letter soft signЬЬ
U+042DЭcyrillic capital letter eЭЭ
U+042EЮcyrillic capital letter yuЮЮ
U+042FЯcyrillic capital letter yaЯЯ
U+0430аcyrillic small letter aаа
U+0431бcyrillic small letter beбб
U+0432вcyrillic small letter veвв
U+0433гcyrillic small letter gheгг
U+0434дcyrillic small letter deдд
U+0435еcyrillic small letter ieее
U+0436жcyrillic small letter zheжж
U+0437зcyrillic small letter zeзз
U+0438иcyrillic small letter iии
U+0439йcyrillic small letter short iйй
U+043Aкcyrillic small letter kaкк
U+043Bлcyrillic small letter elлл
U+043Cмcyrillic small letter emмм
U+043Dнcyrillic small letter enнн
U+043Eоcyrillic small letter oоо
U+043Fпcyrillic small letter peпп
U+0440рcyrillic small letter erрр
U+0441сcyrillic small letter esсс
U+0442тcyrillic small letter teтт
U+0443уcyrillic small letter uуу
U+0444фcyrillic small letter efфф
U+0445хcyrillic small letter haхх
U+0446цcyrillic small letter tseцц
U+0447чcyrillic small letter cheчч
U+0448шcyrillic small letter shaшш
U+0449щcyrillic small letter shchaщщ
U+044Aъcyrillic small letter hard signъъ
U+044Bыcyrillic small letter yeruыы
U+044Cьcyrillic small letter soft signьь
U+044Dэcyrillic small letter eээ
U+044Eюcyrillic small letter yuюю
U+044Fяcyrillic small letter yaяя
U+0450ѐcyrillic small letter ie with graveѐѐ
U+0451ёcyrillic small letter ioёё
U+0452ђcyrillic small letter djeђђ
U+0453ѓcyrillic small letter gjeѓѓ
U+0454єcyrillic small letter ukrainian ieєє
U+0455ѕcyrillic small letter dzeѕѕ
U+0456іcyrillic small letter byelorussian-ukrainian iіі
U+0457їcyrillic small letter yiїї
U+0458јcyrillic small letter jeјј
U+0459љcyrillic small letter ljeљљ
U+045Aњcyrillic small letter njeњњ
U+045Bћcyrillic small letter tsheћћ
U+045Cќcyrillic small letter kjeќќ
U+045Dѝcyrillic small letter i with graveѝѝ
U+045Eўcyrillic small letter short uўў
U+045Fџcyrillic small letter dzheџџ
U+0460Ѡcyrillic capital letter omegaѠѠ
U+0461ѡcyrillic small letter omegaѡѡ
U+0462Ѣcyrillic capital letter yatѢѢ
U+0463ѣcyrillic small letter yatѣѣ
U+0464Ѥcyrillic capital letter iotified eѤѤ
U+0465ѥcyrillic small letter iotified eѥѥ
U+0466Ѧcyrillic capital letter little yusѦѦ
U+0467ѧcyrillic small letter little yusѧѧ
U+0468Ѩcyrillic capital letter iotified little yusѨѨ
U+0469ѩcyrillic small letter iotified little yusѩѩ
U+046AѪcyrillic capital letter big yusѪѪ
U+046Bѫcyrillic small letter big yusѫѫ
U+046CѬcyrillic capital letter iotified big yusѬѬ
U+046Dѭcyrillic small letter iotified big yusѭѭ
U+046EѮcyrillic capital letter ksiѮѮ
U+046Fѯcyrillic small letter ksiѯѯ
U+0470Ѱcyrillic capital letter psiѰѰ
U+0471ѱcyrillic small letter psiѱѱ
U+0472Ѳcyrillic capital letter fitaѲѲ
U+0473ѳcyrillic small letter fitaѳѳ
U+0474Ѵcyrillic capital letter izhitsaѴѴ
U+0475ѵcyrillic small letter izhitsaѵѵ
U+0476Ѷcyrillic capital letter izhitsa with double grave accentѶѶ
U+0477ѷcyrillic small letter izhitsa with double grave accentѷѷ
U+0478Ѹcyrillic capital letter ukѸѸ
U+0479ѹcyrillic small letter ukѹѹ
U+047AѺcyrillic capital letter round omegaѺѺ
U+047Bѻcyrillic small letter round omegaѻѻ
U+047CѼcyrillic capital letter omega with titloѼѼ
U+047Dѽcyrillic small letter omega with titloѽѽ
U+047EѾcyrillic capital letter otѾѾ
U+047Fѿcyrillic small letter otѿѿ
U+0480Ҁcyrillic capital letter koppaҀҀ
U+0481ҁcyrillic small letter koppaҁҁ
U+0482҂cyrillic thousands sign҂҂
U+0483а҃combining cyrillic titlo҃҃
U+0484а҄combining cyrillic palatalization҄҄
U+0485а҅combining cyrillic dasia pneumata҅҅
U+0486а҆combining cyrillic psili pneumata҆҆
U+0487а҇combining cyrillic pokrytie҇҇
U+0488а҈combining cyrillic hundred thousands sign҈҈
U+0489а҉combining cyrillic millions sign҉҉
U+048AҊcyrillic capital letter short i with tailҊҊ
U+048Bҋcyrillic small letter short i with tailҋҋ
U+048CҌcyrillic capital letter semisoft signҌҌ
U+048Dҍcyrillic small letter semisoft signҍҍ
U+048EҎcyrillic capital letter er with tickҎҎ
U+048Fҏcyrillic small letter er with tickҏҏ
U+0490Ґcyrillic capital letter ghe with upturnҐҐ
U+0491ґcyrillic small letter ghe with upturnґґ
U+0492Ғcyrillic capital letter ghe with strokeҒҒ
U+0493ғcyrillic small letter ghe with strokeғғ
U+0494Ҕcyrillic capital letter ghe with middle hookҔҔ
U+0495ҕcyrillic small letter ghe with middle hookҕҕ
U+0496Җcyrillic capital letter zhe with descenderҖҖ
U+0497җcyrillic small letter zhe with descenderҗҗ
U+0498Ҙcyrillic capital letter ze with descenderҘҘ
U+0499ҙcyrillic small letter ze with descenderҙҙ
U+049AҚcyrillic capital letter ka with descenderҚҚ
U+049Bқcyrillic small letter ka with descenderққ
U+049CҜcyrillic capital letter ka with vertical strokeҜҜ
U+049Dҝcyrillic small letter ka with vertical strokeҝҝ
U+049EҞcyrillic capital letter ka with strokeҞҞ
U+049Fҟcyrillic small letter ka with strokeҟҟ
U+04A0Ҡcyrillic capital letter bashkir kaҠҠ
U+04A1ҡcyrillic small letter bashkir kaҡҡ
U+04A2Ңcyrillic capital letter en with descenderҢҢ
U+04A3ңcyrillic small letter en with descenderңң
U+04A4Ҥcyrillic capital ligature en gheҤҤ
U+04A5ҥcyrillic small ligature en gheҥҥ
U+04A6Ҧcyrillic capital letter p with middle hookҦҦ
U+04A7ҧcyrillic small letter p with middle hookҧҧ
U+04A8Ҩcyrillic capital letter abkhasian haҨҨ
U+04A9ҩcyrillic small letter abkhasian haҩҩ
U+04AAҪcyrillic capital letter es with descenderҪҪ
U+04ABҫcyrillic small letter es with descenderҫҫ
U+04ACҬcyrillic capital letter te with descenderҬҬ
U+04ADҭcyrillic small letter te with descenderҭҭ
U+04AEҮcyrillic capital letter straight uҮҮ
U+04AFүcyrillic small letter straight uүү
U+04B0Ұcyrillic capital letter straight u with strokeҰҰ
U+04B1ұcyrillic small letter straight u with strokeұұ
U+04B2Ҳcyrillic capital letter ha with descenderҲҲ
U+04B3ҳcyrillic small letter ha with descenderҳҳ
U+04B4Ҵcyrillic capital ligature te tseҴҴ
U+04B5ҵcyrillic small ligature te tseҵҵ
U+04B6Ҷcyrillic capital letter che with descenderҶҶ
U+04B7ҷcyrillic small letter che with descenderҷҷ
U+04B8Ҹcyrillic capital letter che with vertical strokeҸҸ
U+04B9ҹcyrillic small letter che with vertical strokeҹҹ
U+04BAҺcyrillic capital letter shhaҺҺ
U+04BBһcyrillic small letter shhaһһ
U+04BCҼcyrillic capital letter abkhasian cheҼҼ
U+04BDҽcyrillic small letter abkhasian cheҽҽ
U+04BEҾcyrillic capital letter abkhasian che with descenderҾҾ
U+04BFҿcyrillic small letter abkhasian che with descenderҿҿ
U+04C0Ӏcyrillic letter palochkaӀӀ
U+04C1Ӂcyrillic capital letter zhe with breveӁӁ
U+04C2ӂcyrillic small letter zhe with breveӂӂ
U+04C3Ӄcyrillic capital letter ka with hookӃӃ
U+04C4ӄcyrillic small letter ka with hookӄӄ
U+04C5Ӆcyrillic capital letter el with tailӅӅ
U+04C6ӆcyrillic small letter el with tailӆӆ
U+04C7Ӈcyrillic capital letter en with hookӇӇ
U+04C8ӈcyrillic small letter en with hookӈӈ
U+04C9Ӊcyrillic capital letter en with tailӉӉ
U+04CAӊcyrillic small letter en with tailӊӊ
U+04CBӋcyrillic capital letter khakassian cheӋӋ
U+04CCӌcyrillic small letter khakassian cheӌӌ
U+04CDӍcyrillic capital letter em with tailӍӍ
U+04CEӎ

́ — Комбинируемый акут (лёгкое ударение) (U+0301)

Описание символа

Комбинируемый акут (лёгкое ударение). Комбинируемые диакритические знаки.

Кодировка

Кодировкаhexdec (bytes)decbinary
UTF-8CC 81204 1295235311001100 10000001
UTF-16BE03 013 176900000011 00000001
UTF-16LE01 031 325900000001 00000011
UTF-32BE00 00 03 010 0 3 176900000000 00000000 00000011 00000001
UTF-32LE01 03 00 001 3 0 01697382400000001 00000011 00000000 00000000

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *