— Знак нулевой ширины (без объединения) (U+200C) zwnj
Описание символа
Знак нулевой ширины (без объединения). Знаки пунктуации.
Кодировка
Кодировка | hex | dec (bytes) | dec | binary |
---|---|---|---|---|
UTF-8 | E2 80 8C | 226 128 140 | 14844044 | 11100010 10000000 10001100 |
UTF-16BE | 20 0C | 32 12 | 8204 | 00100000 00001100 |
UTF-16LE | 0C 20 | 12 32 | 3104 | 00001100 00100000 |
UTF-32BE | 00 00 20 0C | 0 0 32 12 | 8204 | 00000000 00000000 00100000 00001100 |
UTF-32LE | 0C 20 00 00 | 12 32 0 0 | 203423744 | 00001100 00100000 00000000 00000000 |
⁐ — Закрывать (U+2050) — Таблица символов Юникода®
Описание символа
Кодировка
Кодировка | hex | dec (bytes) | dec | binary |
---|---|---|---|---|
UTF-8 | E2 81 90 | 226 129 144 | 14844304 | 11100010 10000001 10010000 |
UTF-16BE | 20 50 | 32 80 | 8272 | 00100000 01010000 |
UTF-16LE | 50 20 | 80 32 | 20512 | |
UTF-32BE | 00 00 20 50 | 0 0 32 80 | 8272 | 00000000 00000000 00100000 01010000 |
UTF-32LE | 50 20 00 00 | 80 32 0 0 | 1344274432 | 01010000 00100000 00000000 00000000 |
♨ — Горячие источники (U+2668) Эмоджи
Описание символа
Картографический символ для представления естественных горячих источников. В первую очередь японских онсенов.Этот текст также доступен на следующих языках: English;
Кодировка
Кодировка | hex | dec (bytes) | dec | binary |
---|---|---|---|---|
UTF-8 | E2 99 A8 | 226 153 168 | 14850472 | 11100010 10011001 10101000 |
UTF-16BE | 26 68 | 38 104 | 9832 | 00100110 01101000 |
UTF-16LE | 68 26 | 104 38 | 26662 | 01101000 00100110 |
UTF-32BE | 00 00 26 68 | 0 0 38 104 | 9832 | 00000000 00000000 00100110 01101000 |
UTF-32LE | 68 26 00 00 | 104 38 0 0 | 1747320832 | 01101000 00100110 00000000 00000000 |
Наборы с этим символом:
Алфавиты — Таблица символов Юникода®
Алфавит или азбука — это набор знаков для графического представления звуков, расположенных в определённом порядке. В узком смысле, каждому звуку языка должен быть сопоставлен один символ, однако, на практике такое встречается крайне редко. Например, в русском, буква ь не произносится, в английском, две буквы th читаются как один звук ɵ. Поэтому, в более широком смысле — это просто упорядоченный набор знаков из которых составляются слова. Тут важно принципиальное отличие алфавитной системы письма от идеографической, логографической, иероглифической в которых, символы обозначают целые слова или морфемы (наименьшая языковая единица, имеющая какой-то определённый смысл).
Алфавиты бывают следующих типов:
- Константные. В них есть только согласные буквы. Гласные либо опускаются, либо обозначаются диакритиками (значки вроде апострофа или точки где-то рядом с буквой.) Например, арабский.
- Константно-вокалические. Все гласные имеют свои символы в азбуке и записываются явно. Как в греческом.
- Слоговые. В узком смысле, не считаются алфавитами. Каждая буква означает слог. Причём, в общем случае, изображения слогов, с одинаковыми согласными или гласными звуками, может не иметь ничего общего (чероки слоговый алфавит: ха — Ꭽ, хо — Ꮀ, хи —Ꭿ). А в силлабариях типа абугида, все буквы «по умолчанию» означают слог с конкретной базовой гласной, а слоги с другими гласными образуются видоизменением этих букв (деванагари: ка — क, ки — कि, ко — कॊ).
Самым старым считается алфавит города-государства Угарит. Он известен с середины 2-ого тысячелетия до нашей эры. Немного позже появляется финикийский, который стал родоначальником большинства современных письменностей. Сам термин «алфавит» пошёл от названия первых двух букв — алеф 𐤀 и бет 𐤁.
Изобретение алфавитной системы письма стало важным достижением в истории человечества. По сравнению с пиктографическим, идеографическим или иероглифическим письмом, которые могли содержать тысячи знаков, эта письменность была гораздо проще для изучения. Кроме того, азбука не привязана к языку, или материалу, на котором делается запись. Хорошим примером письма, которым можно записать много разных языков, является Международный Фонетический Алфавит (МФА). Он разрабатывался как раз с этой целью. Всё это послужило делу обмена и сохранения информации, развитию международных отношений.
— Режим обычного ASCII (U+000F)
Описание символа
Режим обычного ASCII. Управляющие символы.
Кодировка
Кодировка | hex | dec (bytes) | dec | binary |
---|---|---|---|---|
UTF-8 | 0F | 15 | 15 | 00001111 |
UTF-16BE | 00 0F | 0 15 | 15 | 00000000 00001111 |
UTF-16LE | 0F 00 | 15 0 | 3840 | 00001111 00000000 |
UTF-32BE | 00 00 00 0F | 0 0 0 15 | 15 | 00000000 00000000 00000000 00001111 |
UTF-32LE | 0F 00 00 00 | 15 0 0 0 | 251658240 | 00001111 00000000 00000000 00000000 |
└ — Граница легкая вверх и направо (U+2514)
Описание символа
Граница легкая вверх и направо. Символы для рисования рамок.
Кодировка
Кодировка | hex | dec (bytes) | dec | binary |
---|---|---|---|---|
UTF-8 | E2 94 94 | 226 148 148 | 14849172 | 11100010 10010100 10010100 |
UTF-16BE | 25 14 | 37 20 | 9492 | 00100101 00010100 |
UTF-16LE | 14 25 | 20 37 | 5157 | 00010100 00100101 |
UTF-32BE | 00 00 25 14 | 0 0 37 20 | 9492 | 00000000 00000000 00100101 00010100 |
UTF-32LE | 14 25 00 00 | 20 37 0 0 | 337969152 | 00010100 00100101 00000000 00000000 |
— Режим национальных символов (U+000E)
Описание символа
Режим национальных символов. Управляющие символы.
Кодировка
Кодировка | hex | dec (bytes) | dec | binary |
---|---|---|---|---|
UTF-8 | 0E | 14 | 14 | 00001110 |
UTF-16BE | 00 0E | 0 14 | 14 | 00000000 00001110 |
UTF-16LE | 0E 00 | 14 0 | 3584 | 00001110 00000000 |
UTF-32BE | 00 00 00 0E | 0 0 0 14 | 14 | 00000000 00000000 00000000 00001110 |
UTF-32LE | 0E 00 00 00 | 14 0 0 0 | 234881024 | 00001110 00000000 00000000 00000000 |