16. Кодировка HTML страницы и атрибуты — Знакомство с HTML — codebra
Дополнительное видео по теме
Как добавить кодировку страницы?
Вы когда-нибудь видели на странице в интернете какие-то знаки вопроса, квадратики и прочее вместо текста? Думаю, что видели. Так вот, у этого сайта проблема с кодировкой, вполне возможно разработчик ее не указал. Кодировка, простыми словами, это таблица содержащая набор символов. Для того чтобы добавить кодировку сайта, нужен многофункциональный тег <meta>
, о нем написан целый урок. Итак, чтобы браузер понял, какую кодировку вы используете, применяйте эту строку:
Код HTML
<meta charset = "utf-8">
Что такое кодировка?
Кодировка, это набор символов, представленный в таблице. Таблица содержит сам символ и его код, например, двоичный (нули и единицы). Термин «набор символов» редко используется, чаще всего говорят «кодировка». На данный момент популярны две кодировки: ASCII и UTF-8. На нашем сайте используется кодировка UTF-8
.
Подробнее о кодировке?
Кодировка ASCII является американской и разрабатывалась для английского языка. Так как, к примеру, французский язык имеет надстрочные знаки, а русский алфавит не похож на английский, был разработан стандарт Unicode для расширения кодировки ASCII. Но и в Unicode, со временем, стало не хватать места для размещения новых символов. Поэтому на основе Unicode создали кодировку UTF-8, которая исправила эти недостатки. UTF-8 позволяет кодировать до 2 миллиардов символов, поэтому она доминирует в интернете.
В UTF-8 коды от 0 до 127 используются для представления символов ASCII. Если символ не входит в набор ASCII, то старший бит первого байта устанавливается в 1, что свидетельствует о дополнительном использовании байтов. То есть если в документе используются только символы из ASCII, то каждый символ в UTF-8 будет кодироваться восьмью битами.
Что такое атрибуты?
Настало время познакомиться с атрибутами в HTML. Вы их уже встречали, просто на них не акцентировалось внимание. Атрибуты – это дополнение к тегам, расширяющее их возможности. Они всегда указываются в открывающемся теге. Атрибут состоит из имени и значения, разделенного знаком равенства.
Имя атрибута необходимо писать в нижнем регистре. Хотя HTML5 и позволяет писать в любом регистре и не использовать кавычки, все же так не рекомендуется делать.
Похожие уроки и записи блога
Первое знакомство с PythonЗнакомство с Python
Работа с файлами в Python Знакомство с Python
Погружение в PythonЗнакомство с Python
Функциональное программирование: map, filter и reduceЗнакомство с Python
Типы данных в PythonЗнакомство с Python
Что такое HTML?Знакомство с HTML
Основы объектно-ориентированного программирования (ООП) в PythonЗнакомство с Python
Модули в PythonЗнакомство с Python
Универсальные атрибуты в HTMLРазметка текста
Предыдущий урок «15. Тест по структуре HTML документа» Следующий урок «17. Описание стилей в HTML документе»
HTML кодировки-W3Docs
❮ Назад Вперед ❯
Для того, чтобы браузер смог правильно отобразить текст на веб-странице, необходимо указать ее кодировку. В противном случае вместо текста на веб-странице будут отображаться непонятные символы.
Кодировку указывают в теге <meta> который находится в блоке <head>.
Пример
<head> <meta charset="utf-8"> </head>
В HTML 5 для указания кодировки используется атрибут charset: <meta charset=»utf-8″>
Рассмотрим основные виды кодировок
ASCII (American Standard Code for Information Interchange), американский стандартный кодекс для обмена информацией между компьютерными и аппаратными устройствами был придуман в 60 годах прошлого века. ASCII — 7-битная кодовая таблица, которая содержит 128 символов (цифры от 1 до 9, прописные и строчные латинские буквы, специальные символы).
Печатные символы ASCII
Со временем стандарт кодировки ASCII расширялся, появилась возможность использовать не 128, а 256 символов, которые можно закодировать в одном байте информации. Одной из расширенных версий ASCII является ANSI (American National Standards Institute). Примером ANSI-кодировки является Windows-1251, которая включает типографические символы, а также буквы алфавитов славянских народов.
Организация Международных стандартов (International Standards Organization) ввела диапазон кодировок для разных языков, от ISO 8859-1 до ISO 8859-16.
В большинстве браузеров по умолчанию используется кодировка ISO-8859-1. Кодировка символов от 0 до 127 в ISO-8859-1 соответствует кодировке ASCII (цифры от 1 до 9, заглавные и строчные буквы английского алфавита и несколько спецсимволов).
В HTML 4 любая кодировка, отличная от стандарта ISO-8859-1, должна быть указана в теге <meta> .
Таблица кодов символов ISO-8859-1
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">
В 1991 году был разработан универсальный стандарт кодирования Unicode Transformation Format (UTF), благодаря которому стало возможным представить знаки практически всех известных письменных языков. Разработчиками стандарта была некоммерческая организация Unicode Consortium.
Первой была разработана кодировка UTF-32, затем UTF-16, и наконец появился стандарт UTF-8.
В UTF-32 для кодирования одного символа использовалось 32 бита (4 байта), что увеличивало вес конечного файла в 4 раза. В UTF-16 вес снизился вдвое, так как для кодирования использовалось уже 16 бит, но и это было далеко не оптимальным решением. Разработанный впоследствии стандарт UTF-8 на сегодняшний день считается самым оптимальным. Для кодирования одного символа в UTF-8 используется от 1 до 4 байт. Он идеально совмещается с системами, которые используют 8-битные символы.
UTF-8 унаследовал базовую часть кодировки ASCII (128 символов), то есть для кодировки латинских символов используется 8 бит (1 байт). Все последующие символы кодируются двумя байтами и более.
HTML4 поддерживает только кодировку UTF-8. В HTML5 поддерживаются как UTF-8, так и UTF-16.
Таблица кодов символов UTF-8
Знаки с кодами от U+0400 до U+052F, от U+2DE0 до U+2DFF, от U+A640 до U+A69F кодируют символы кириллицы.
Кодировка HTML URL
❮ Предыдущая Далее ❯
URL — это другое слово для веб-адреса.
URL-адрес может состоять из слов (например, w3schools.com) или IP-адреса (например, 192.68.20.50).
Большинство людей вводят имя при просмотре веб-страниц, потому что имена легче запомнить, чем числа.
URL-адрес — унифицированный указатель ресурсов
Веб-браузеры запрашивают страницы с веб-серверов, используя URL-адрес.
Унифицированный указатель ресурсов (URL) используется для адресации документа (или других данных) в Интернете.
Веб-адрес, например https://www.w3schools.com/html/default.asp следует следующим правилам синтаксиса:
схема://префикс.домен:порт/путь/имя файла
Объяснение:
- схема — определяет тип интернет-сервиса (чаще всего это http или https )
- префикс — определяет префикс домена (по умолчанию для http www )
- домен — определяет Интернет доменное имя (например, w3schools.com)
- путь — определяет путь на сервере (если не указано: корневой каталог сайта)
- имя файла — определяет имя документа или ресурса
Общие схемы URL
В таблице ниже перечислены некоторые распространенные схемы:
Схема | Сокращение от | Используется для |
---|---|---|
http | Протокол передачи гипертекста | Общие веб-страницы. Не зашифровано |
https | Безопасный протокол передачи гипертекста | Безопасные веб-страницы. Зашифровано |
фтп | Протокол передачи файлов | Загрузка или выгрузка файлов |
файл | Файл на вашем компьютере |
Кодирование URL-адресов
URL-адреса можно отправлять только через Интернет с помощью Набор символов ASCII. Если URL-адрес содержит символы, не входящие в набор ASCII, URL-адрес должен быть преобразован.
Кодирование URL-адресов преобразует символы, отличные от ASCII, в формат, пригодный для передачи через Интернет.
Кодировка URL заменяет символы, отличные от ASCII, символом «%», за которым следуют шестнадцатеричные цифры.
URL не могут содержать пробелы. Кодировка URL обычно заменяет пробел знаком плюс (+) или %20.
Попробуйте сами
Если вы нажмете «Отправить», браузер будет кодировать ввод перед отправкой на сервер.
Страница на сервере будет отображать полученный ввод.
Попробуйте ввести другие данные и снова нажмите «Отправить».
Примеры кодировки ASCII
Ваш браузер будет кодировать ввод в соответствии с набором символов, используемым на вашей странице.
Набор символов по умолчанию в HTML5 — UTF-8.
Символ | Из Windows-1252 | Из UTF-8 |
---|---|---|
€ | %80 | %Е2%82%АС |
£ | %A3 | %С2%А3 |
© | %A9 | %C2%A9 |
® | %AE | %C2%AE |
А | %C0 | %С3%80 |
А | %С1 | %С3%81 |
 | %С2 | %С3%82 |
à | %С3 | %С3%83 |
Ä | %С4 | %С3%84 |
Å | %С5 | %С3%85 |
Полную информацию обо всех кодировках URL см. Справочник по кодировке URL.
❮ Предыдущий Следующий ❯
ВЫБОР ЦВЕТА
Лучшие учебники
Учебник по HTMLУчебник по CSS
Учебник по JavaScript
Учебник How To
Учебник по SQL
Учебник по Python
Учебник по W3.CSS
Учебник по Bootstrap
Учебник по PHP
Учебник по Java
Учебник по C++
Учебник по jQuery
3 903 Справочник
Справочник по HTML
Справочник по CSS
Справочник по JavaScript
Справочник по SQL
Справочник по Python
Справочник по W3.CSS
Справочник по Bootstrap
Справочник по PHP
Цвета HTML
Справочник по Java
Справочник по Angular
Справочник по jQuery
Основные примеры
Примеры HTMLПримеры CSS
Примеры JavaScript
Примеры инструкций
Примеры SQL
Примеры Python
Примеры W3.CSS
Примеры Bootstrap
Примеры PHP
Примеры Java
Примеры XML
Примеры jQuery
FORUM | О
W3Schools оптимизирован для обучения и обучения.
Copyright 1999-2023 Refsnes Data. Все права защищены.
W3Schools работает на основе W3.CSS.
URL-кодирование Ссылка
Справочник по URL-кодированиюНиже приведены ссылки на символы ASCII в Форма URL-кодирования (шестнадцатеричный формат).
Шестнадцатеричные значения могут использоваться для отображения нестандартных букв и символов в браузерах и плагины.
URL-кодирование от %00 до %8f
Значение ASCII | URL-код | Значение ASCII | URL-код | Значение ASCII | URL-кодирование | |
---|---|---|---|---|---|---|
%00 | 0 | %30 | ` | %60 | ||
%01 | 1 | %31 | и | %61 | ||
%02 | 2 | %32 | б | %62 | ||
%03 | 3 | %33 | с | %63 | ||
%04 | 4 | %34 | д | %64 | ||
%05 | 5 | %35 | и | %65 | ||
%06 | 6 | ф | %66 | |||
%07 | 7 | %37 | г | %67 | ||
пробел | %08 | 8 | %38 | ч | %68 | |
вкладка | %09 | 9 | %39 | я | %69 | |
перевод строки | %0а | : | %3а | и | %6а | |
%0b | ; | %3b | к | %6b | ||
%0c | < | %3c | л | %6с | ||
с возвратом | %0d | = | %3d | м | %6д | |
%0е | > | %3e | п | %6e | ||
%0f | ? | %3f | или | %6f | ||
%10 | @ | %40 | р | %70 | ||
%11 | А | %41 | к | %71 | ||
%12 | Б | %42 | р | %72 | ||
%13 | С | %43 | с | %73 | ||
%14 | Д | %44 | т | %74 | ||
%15 | Е | %45 | и | %75 | ||
%16 | Ф | %46 | против | %76 | ||
%17 | Г | %47 | с | %77 | ||
%18 | Х | %48 | х | %78 | ||
%19 | я | %49 | и | %79 | ||
%1а | Дж | %4а | с | %7а | ||
%1b | К | %4b | { | %7b | ||
%1с | л | %4с | | | %7с | ||
%1д | М | %4д | } | %7д | ||
%1e | Н | %4е | ~ | %7е | ||
%1f | О | %4f | %7f | |||
пробел | %20 | Р | %50 | € | %80 | |
! | %21 | В | %51 | %81 | ||
» | %22 | Р | %52 | ‚ | %82 | |
# | %23 | С | %53 | ƒ | %83 | |
$ | %24 | Т | %54 | „ | %84 | |
% | %25 | У | %55 | … | %85 | |
и | %26 | В | %56 | † | %86 | |
%27 | Вт | %57 | ‡ | %87 | ||
( | %28 | х | %58 | ˆ | %88 | |
) | %29 | Д | %59 | ‰ | %89 | |
* | %2а | З | %5а | Š | %8а | |
+ | %2b | [ | %5b 9 | %5е | Ž | %8е |
/ | %2f | _ | %5f | %8f |
Значение ASCII | URL-код | Значение ASCII | URL-код | Значение ASCII | URL-кодирование |
---|---|---|---|---|---|
%90 | %с0 | %f0 | |||
‘ | %91 | %с1 | %f1 | ||
’ | %92 | %c2 | %f2 | ||
» | %93 | %с3 | %f3 | ||
” | %94 | %с4 | %f4 | ||
• | %95 | %c5 | %f5 | ||
– | %96 | %с6 | %f6 | ||
— | %97 | %с7 | %f7 | ||
~ | %98 | %с8 | %f8 | ||
™ | %99 | %с9 | %f9 | ||
š | %9а | %ca | %пк | ||
› | %9б | %кб | %fb | ||
– | %9с | % куб. см | %фк | ||
%9д | %кд | %fd | |||
ž | %9е | %ce | %fe | ||
Ÿ | %9f | %cf | %ff | ||
%a0 | %d0 | ||||
%a1 | %d1 | ||||
%а2 | %d2 | ||||
%а3 | %d3 | ||||
%а4 | %d4 | ||||
%a5 | %d5 | ||||
| | %а6 | %d6 | |||
%а7 | %d7 | ||||
%а8 | %d8 | ||||
%а9 | %d9 | ||||
%аа | %да | ||||
%ab | % дб | ||||
%акр | % постоянного тока | ||||
%ad | %дд | ||||
% кэ | % от | ||||
% от | %df | ||||
%b0 | %e0 | ||||
%b1 | %e1 | ||||
%b2 | %e2 | ||||
%b3 | %e3 | ||||
%b4 | %e4 | ||||
%b5 | %e5 | ||||
%b6 | %e6 | ||||
%b7 | %e7 | ||||
%b8 | %e8 | ||||
%b9 | %e9 | ||||
%ба | % шт. |