Html код кавычки: Как ставить кавычки на клавиатуре и в HTML

Волшебные кавычки > О том, как правильно делать сайты! > LILIA-WEB.NAROD.RU

Волшебные кавычки

По ходу текста некоторые слова, такие как цитаты или названия книг и фильмов, приходится брать в кавычки. При этом существует несколько типов кавычек, которые применяются в зависимости от правил языка и контекста. С помощью CSS процесс добавления кавычек можно упростить и добавлять кавычки желаемого вида в нужное место автоматически.

В русской типографике используется три вида кавычек, их вид и описание приведены в табл. 1.

Табл. 1. Виды кавычек в русскоязычных текстах

Вид Описание Код HTML
«текст» Такие кавычки перешли по наследию от пишущих машинок. В настоящее время применяются в языках программирования и коде HTML.
Значения параметров тегов указываются именно в таких кавычках.
 «текст» или "текст"
«текст» Эти кавычки встречаются в текстах чаще всего. «текст» или «текст»
„текст“ Применяется в тексте самостоятельно вместо предыдущего типа кавычек или совместно с ним. Например, если требуется добавить кавычки в кавычках, пишем так: «Грязно ругаясь и поминая недобрым словом сопромат, он протянул искореженную „вжепурезку“ мне». „текст“ или „текст“

Как видно из данной таблицы, кавычки в код документа добавляются двумя способами. Первый включает в себя прямую вставку символов кавычек в текст. Но поскольку многие HTML-редакторы не поддерживают подобные символы, то приходится набирать текст в специализированных программах (Microsoft Word, например), а затем добавлять его в код веб-страницы через буфер обмена. Второй способ состоит в применении спецсимволов, которые в браузере отображаются нужным нам образом.

Теперь зададимся вопросом, а как быстро можно поменять в тексте один вид кавычек на другой? Увы, но автоматизировать этот процесс сложно и в конечном итоге приходится вычитывать текст и править его вручную. Поиск и замена текста тоже не всегда дает нужный результат — попробуйте, например, поменять везде "

на «, интересный эффект получится.

В CSS для управления кавычками используется свойство quotes, с помощью которого можно определять вид кавычек для заданных элементов. Это позволяет ставить те кавычки, которые подходят по контексту.

Примечание
Браузер Internet Explorer не поддерживает множество возможностей CSS, в том числе свойства quotes и content, поэтому нижеприведенные примеры в нем работать не будут.

Так, для выделения цитат предназначен тег <Q>. Его особенностью является то, что текст, заключенный в этот контейнер автоматически берется в кавычки.

Другое дело, что кавычки по умолчанию ставятся вида «/». Однако это дело можно поправить, как показано в примере 1.
 

Пример 1. Использование тега <Q>
<!DOCTYPE HTML PUBLIC «-//W3C//DTD HTML 4.01 Transitional//EN»>
<html>
<head>
<style type=»text/css»>
Q {
 font-style: italic; /* Курсивное начертание */
 quotes: ««» «»» /* Меняем вид кавычек в цитате */
}
</style>
</head>
<body>

<p>Из закона Фергюсона-Мержевича: <q>Вероятность того, что неприятность произойдет, снижается, если данную неприятность предусмотреть заранее</q>.

</p>

</body>
</html>

Результат примера показан ниже.

Из закона Фергюсона-Мержевича: Вероятность того, что неприятность произойдет, снижается, если данную неприятность предусмотреть заранее.

В данном примере в качестве значения свойства quotes использовалась строка ««» «»». Первый символ определяет открывающую кавычку, а второй через пробел — закрывающую кавычку. В качестве значений можно указывать любой текст, а также символы юникода, которые приведены в табл. 2.

Табл. 2. Символы юникода для обозначения кавычек

Вид Спецсимвол HTML Юникод

«

 &#34; \0022
« &#171; или &laquo; \00ab
» &#187; или &raquo; \00bb
 &#8220; \201c
 &#8222; \201e

Используя приведенные в табл. 2 символы юникода, пример 1 можно изменить следующим образом (пример 2).

Пример 2. Применение юникода

<!DOCTYPE HTML PUBLIC «-//W3C//DTD HTML 4.01 Transitional//EN»>
<html>
<head>
<style type=»text/css»>
Q {
 font-style: italic; /* Курсивное начертание */
 quotes: «\00ab» «\00bb» /* Меняем вид кавычек в цитате */
}
</style>
</head>
<body>

<p>Из закона Фергюсона-Мержевича: <q>Вероятность того, что неприятность произойдет, снижается, если данную неприятность предусмотреть заранее</q>. </p>

</body>
</html>

Кавычки для содержимого тега <Q> устанавливаются браузером автоматически, но это правило не касается других тегов. Для добавления кавычек к тексту воспользуемся стилевым свойством content с псевдоэлементами before и after, как показано в примере 3. В данном случае используются не кавычки, а угловые скобки, которые применяются для обозначения тегов.

Пример 3. Добавление кавычек к тексту

<!DOCTYPE HTML PUBLIC «-//W3C//DTD HTML 4.01 Transitional//EN»>
<html>
<head>
<style type=»text/css»>
SPAN.tag {
 color: navy; /* Цвет текста */
 font-family: monospace; /* Моношириный шрифт */
 quotes: «<» «>» /* Устанавливаем вид кавычек */
}

SPAN. tag:before {
 content: open-quote /* Добавляем перед текстом открывающую кавычку */
}

SPAN.tag:after {
 content: close-quote /* Добавляем после текста закрывающую кавычку */
}
</style>
</head>
<body>

<p>Тег <span>CITE</span> помечает текст как цитату или сноску на другой материал. Браузеры обычно устанавливают текст внутри контейнера <span>CITE</span> курсивом.</p>

</body>
</html>

Результат примера показан ниже.

Тег CITE помечает текст как цитату или сноску на другой материал. Браузеры обычно устанавливают текст внутри контейнера CITE курсивом.

Разберем данный пример подробнее. Для выделения в тексте тегов вводим новый класс tag, к тексту которого добавляются кавычки вида </> с помощью свойства quotes. Но чтобы они отображались этого не достаточно. Поэтому используем псевдоэлемент before, он вставляет определенный контент перед указанным элементом, и after, добавляющий контент после элемента. Открывающая скобка генерируется через значение open-quote параметра content, а закрывающая — через close-quote.

Можно вообще отказаться от использования параметра quotes, поскольку атрибут content позволяет добавлять определенный текст до и после элемента. В качестве значения этого параметра в кавычках указываем нужный символ в виде обычного текста или юникода. Опять же в данном случае не обойтись без применения псевдоэлементов before и after, как показано в примере 4.

Пример 4. Применение параметра content
<!DOCTYPE HTML PUBLIC «-//W3C//DTD HTML 4.01 Transitional//EN»>
<html>
<head>
<style type=»text/css»>
CITE {
 color: navy /* Цвет текста */
}

CITE:before {
 content: «\00ab» /* Добавляем открывающую кавычку */
}

CITE:after {
 content: «\00bb» /* Добавляем закрывающую кавычку */
}
</style>
</head>
<body>

<p>Первое следствие из закона Фергюсона-Мержевича: <cite>Все неприятности предусмотреть невозможно</cite>. </p>
<p>Второе следствие: <cite>Из всех непредусмотренных неприятностей вероятнее всего произойдет та, ущерб от которой наибольший</cite>.</p>

</body>
</html>

В данном примере добавление кавычек к тексту и определение их вида выполняет один параметр content.


Специальные символы HTML — Exlab

Специальные символы в HTML реализуются с помощью интерпретируемых браузером мнемоник и числовых кодов. Например, двойную кавычку («) можно вывести кодом &quot;, а знак евро (€) — &euro;. Все мнемокоды начинаются с амперсанда (&) и заканчиваются точкой с запятой (;). Чтобы обычный амперсанд в тексте не путался с началом мнемокода, его выводят с помощью кода &amp;.

Числовыми кодами можно отобразить любые символы UTF-8. Такие коды имеют вид &#xxxx;, где вместо xxxx указывается десятичный номер символа в кодировке UTF-8. Например, &#169; отобразится как «©».

ASCII-символы
СимволНазваниеМнемоникаКод
одинарная кавычка&#39;
«двойная кавычка&quot;&#34;
<меньше&lt;&#60;
>больше&gt;&#62;
 неразрывный пробел&nbsp;&#160;
­«мягкий» перенос&shy;&#173;
¡перевёрнутый восклицательный знак&iexcl;&#161;
¿перевёрнутый знак вопроса&iquest;&#191;
¢цент&cent;&#162;
£британский фунт стерлингов&pound;&#163;
¤денежная единица&curren;&#164;
¥японская йена&yen;&#165;
¦разорванная вертикальная черта&brvbar;&#166;
§параграф&sect;&#167;
¨умлаут, трема&uml;&#168;
©знак охраны авторского права&copy;&#169;
®зарегистрированный товарный знак&reg;&#174;
ªпорядковый индикатор (женский род)&ordf;&#170;
ºпорядковый индикатор (мужской род)&ordm;&#186;
«левая двойная угловая кавычка&laquo;&#171;
»правая двойная угловая кавычка&raquo;&#187;
¬отрицание&not;&#172;
±плюс-минус&plusmn;&#177;
´акут («острое ударение»)&acute;&#180;
¸седиль&cedil;&#184;
¯макрон&macr;&#175;
°градус&deg;&#176;
¹верхний индекс «1»&sup1;&#185;
²верхний индекс «2»&sup2;&#178;
³верхний индекс «3»&sup3;&#179;
µмикро&micro;&#181;
обозначение абзаца&para;&#182;
·точка на уровне середины строки&middot;&#183;
¼простая дробь «одна четвёртая»&frac14;&#188;
½простая дробь «одна вторая»&frac12;&#189;
¾простая дробь «три четверти»&frac34;&#190;
Латинские буквы
СимволНазваниеМнемоникаКод
Àлатинская заглавная «A» с грависом&Agrave;&#192;
Áлатинская заглавная «A» с акутом&Aacute;&#193;
Âлатинская заглавная «A» с циркумфлексом&Acirc;&#194;
Ãлатинская заглавная «A» с тильдой&Atilde;&#195;
Äлатинская заглавная «A» с тремой&Auml;&#196;
Åлатинская заглавная «A» с кружком сверху&Aring;&#197;
Æлатинская заглавная лигатура «AE»&AElig;&#198;
Çлатинская заглавная «C» с седилью&Ccedil;&#199;
Èлатинская заглавная «E» с грависом&Egrave;&#200;
Éлатинская заглавная «E» с акутом&Eacute;&#201;
Êлатинская заглавная «E» с циркумфлексом&Ecirc;&#202;
Ëлатинская заглавная «E» с тремой&Euml;&#203;
Ìлатинская заглавная «I» с грависом&Igrave;&#204;
Íлатинская заглавная «I» с акутом&Iacute;&#205;
Îлатинская заглавная «I» с циркумфлексом&Icirc;&#206;
Ïлатинская заглавная «I» с тремой&Iuml;&#207;
Ðлатинская заглавная буква «eth»&ETH;&#208;
Ñлатинская заглавная «N» с тильдой&Ntilde;&#209;
Œлатинская заглавная лигатура «OE»&OElig;&#338;
Òлатинская заглавная «O» с грависом&Ograve;&#210;
Óлатинская заглавная «O» с акутом&Oacute;&#211;
Ôлатинская заглавная «O» с циркумфлексом&Ocirc;&#212;
Õлатинская заглавная «O» с тильдой&Otilde;&#213;
Öлатинская заглавная «O» с тремой&Ouml;&#214;
Øлатинская заглавная «O» диагонально перечёркнутая&Oslash;&#216;
Šлатинская заглавная «S» с птичкой&Scaron;&#352;
Ùлатинская заглавная «U» с грависом&Ugrave;&#217;
Úлатинская заглавная «U» с акутом&Uacute;&#218;
Ûлатинская заглавная «U» с циркумфлексом&Ucirc;&#219;
Üлатинская заглавная «U» с тремой&Uuml;&#220;
Ýлатинская заглавная «Y» с акутом&Yacute;&#221;
Ÿлатинская заглавная «Y» с тремой&Yuml;&#376;
Þлатинская заглавная буква торн&THORN;&#222;
ßлатинский знак «эсцет»&szlig;&#223;
àлатинская «a» с грависом&agrave;&#224;
áлатинская «a» с акутом&aacute;&#225;
âлатинская «a» с циркумфлексом&acirc;&#226;
ãлатинская «a» с тильдой&atilde;&#227;
äлатинская «a» с тремой&auml;&#228;
åлатинская «a» с кружком сверху&aring;&#229;
æлатинская «ae»&aelig;&#230;
çлатинская «c» седилья&ccedil;&#231;
èлатинская «e» с грависом&egrave;&#232;
éлатинская «e» с акутом&eacute;&#233;
êлатинская «e» с циркумфлексом&ecirc;&#234;
ëлатинская «e» с тремой&euml;&#235;
ìлатинская «i» с грависом&igrave;&#236;
íлатинская «i» с акутом&iacute;&#237;
îлатинская «i» с циркумфлексом&icirc;&#238;
ïлатинская «i» с тремой&iuml;&#239;
ðлатинская «eth»&eth;&#240;
ñлатинская «n» с тильдой&ntilde;&#241;
œлатинская лигатура «oe»&oelig;&#339;
òлатинская «o» с грависом&ograve;&#242;
óлатинская «o» с акутом&oacute;&#243;
ôлатинская «o» с циркумфлексом&ocirc;&#244;
õлатинская «o» с тильдой&otilde;&#245;
öлатинская «o» с тремой&ouml;&#246;
øлатинская «o» диагонально перечёркнутая&oslash;&#248;
šлатинская «s» с птичкой&scaron;&#353;
ùлатинская «u» с грависом&ugrave;&#249;
úлатинская «u» с акутом&uacute;&#250;
ûлатинская «u» с циркумфлексом&ucirc;&#251;
üлатинская «u» с тремой&uuml;&#252;
ýлатинская «y» с акутом&yacute;&#253;
ÿлатинская «y» с тремой&yuml;&#255;
þлатинская буква торн&thorn;&#254;
Греческие буквы
СимволНазваниеМнемоникаКод
Αгреческая заглавная альфа&Alpha;&#913;
Βгреческая заглавная бета&Beta;&#914;
Γгреческая заглавная гамма&Gamma;&#915;
Δгреческая заглавная дельта&Delta;&#916;
Εгреческая заглавная эпсилон&Epsilon;&#917;
Ζгреческая заглавная дзета&Zeta;&#918;
Ηгреческая заглавная эта&Eta;&#919;
Θгреческая заглавная тета&Theta;&#920;
Ιгреческая заглавная йота&Iota;&#921;
Κгреческая заглавная каппа&Kappa;&#922;
Λгреческая заглавная лямбда&Lambda;&#923;
Μгреческая заглавная мю&Mu;&#924;
Νгреческая заглавная ню&Nu;&#925;
Ξгреческая заглавная кси&Xi;&#926;
Οгреческая заглавная омикрон&Omicron;&#927;
Πгреческая заглавная пи&Pi;&#928;
Ρгреческая заглавная ро&Rho;&#929;
Σгреческая заглавная сигма&Sigma;&#931;
Τгреческая заглавная тау&Tau;&#932;
Υгреческая заглавная ипсилон&Upsilon;&#933;
Φгреческая заглавная фи&Phi;&#934;
Χгреческая заглавная хи&Chi;&#935;
Ψгреческая заглавная пси&Psi;&#936;
Ωгреческая заглавная омега&Omega;&#937;
αгреческая строчная альфа&alpha;&#945;
βгреческая строчная бета&beta;&#946;
γгреческая строчная гамма&gamma;&#947;
δгреческая строчная дельта&delta;&#948;
εгреческая строчная эпсилон&epsilon;&#949;
ζгреческая строчная дзета&zeta;&#950;
ηгреческая строчная эта&eta;&#951;
θгреческая строчная тета&theta;&#952;
ιгреческая строчная йота&iota;&#953;
κгреческая строчная каппа&kappa;&#954;
λгреческая строчная ламбда&lambda;&#955;
μгреческая строчная мю&mu;&#956;
νгреческая строчная ню&nu;&#957;
ξгреческая строчная кси&xi;&#958;
οгреческая строчная омикрон&omicron;&#959;
πгреческая строчная пи&pi;&#960;
ρгреческая строчная ро&rho;&#961;
ςгреческая конечная сигма&sigmaf;&#962;
σгреческая строчная сигма&sigma;&#963;
τгреческая строчная тау&tau;&#964;
υгреческая строчная ипсилон&upsilon;&#965;
φгреческая строчная фи&phi;&#966;
χгреческая строчная хи&chi;&#967;
ψгреческая строчная пси&psi;&#968;
ωгреческая строчная омега&omega;&#969;
ϑгреческий символ тета&thetasym;&#977;
ϒгреческий ипсилон с хвостиком&upsih;&#978;
ϖгреческий символ пи&piv;&#982;
Стрелки
СимволНазваниеМнемоникаКод
влево&larr;&#8592;
вверх&uarr;&#8593;
вправо&rarr;&#8594;
вниз&darr;&#8595;
влево-вправо&harr;&#8596;
вниз с углом вправо (возврат каретки)&crarr;&#8629;
двойная влево&lArr;&#8656;
двойная вверх&uArr;&#8657;
двойная вправо&rArr;&#8658;
двойная вниз&dArr;&#8659;
двойная влево-вправо&hArr;&#8660;
Математические символы
СимволНазваниеМнемоникаКод
×умножение&times;&#215;
÷деление&divide;&#247;
ƒфункция&fnof;&#402;
квантор всеобщности&forall;&#8704;
частичный дифференциал&part;&#8706;
квантор существования&exist;&#8707;
пустой набор, диаметр&empty;&#8709;
оператор набла&nabla;&#8711;
элемент из множества&isin;&#8712;
элемент не из множества&notin;&#8713;
содержит&ni;&#8715;
произведение&prod;&#8719;
сумма&sum;&#8721;
минус&minus;&#8722;
оператор звёздочка&lowast;&#8727;
квадратный корень&radic;&#8730;
пропорционально к&prop;&#8733;
бесконечность&infin;&#8734;
угол&ang;&#8736;
логическое И&and;&#8743;
логическое ИЛИ&or;&#8744;
пересечение&cap;&#8745;
объединение&cup;&#8746;
интеграл&int;&#8747;
следовательно&there4;&#8756;
оператор тильда (подобие)&sim;&#8764;
конгруэтность&cong;&#8773;
приблизительно равно&asymp;&#8776;
не равно&ne;&#8800;
идентично&equiv;&#8801;
меньше или равно&le;&#8804;
больше или равно&ge;&#8805;
подмножество&sub;&#8834;
включает в себя&sup;&#8835;
не включает в себя&nsub;&#8836;
подмножество или эквивалентно&sube;&#8838;
включает в себя или эквивалентно&supe;&#8839;
прямая сумма&oplus;&#8853;
векторное произведение&otimes;&#8855;
ортогонально к, перпендикулярно&perp;&#8869;
оператор «точка»&sdot;&#8901;
булеан&weierp;&#8472;
мнимая часть&image;&#8465;
вещественная часть&real;&#8476;
мощность множества&alefsym;&#8501;
левая скобка округления вверх&lceil;&#8968;
правая скобка округления вверх&rceil;&#8969;
левая скобка округления вниз&lfloor;&#8970;
правая скобка округления вниз&rfloor;&#8971;
угловая скобка влево&lang;&#9001;
угловая скобка вправо&rang;&#9002;
Дополнительная пунктуация
СимволНазваниеМнемоникаКод
маркер списка (буллит)&bull;&#8226;
горизонтальное многоточие&hellip;&#8230;
штрих&prime;&#8242;
двойной штрих&Prime;&#8243;
надчеркивание&oline;&#8254;
косая черта&frasl;&#8260;
полукегельное тире&ndash;&#8211;
кегельное тире&mdash;&#8212;
левая одинарная английская кавычка&lsquo;&#8216;
правая одинарная английская кавычка&rsquo;&#8217;
левая одинарная кавычка-лапка&sbquo;&#8218;
правая одинарная кавычка-лапка&#8219;
левая двойная английская кавычка&ldquo;&#8220;
правая двойная английская кавычка&rdquo;&#8221;
левые двойные кавычки-лапки&bdquo;&#8222;
правые двойные кавычки-лапки&#8223;
левая угловая кавычка&lsaquo;&#8249;
правая угловая кавычка&rsaquo;&#8250;
&амперсанд&amp;&#38;
промилле&permil;&#8240;
номер&#8470;
полукегельная шпация&ensp;&#8194;
кегельная шпация&emsp;&#8195;
четвертная шпация&thinsp;&#8201;
несоединяющий символ нулевой длины&zwnj;&#8204;
соединяющий символ нулевой длины&zwj;&#8205;
указатель слева направо&lrm;&#8206;
указатель справа налево&rlm;&#8207;
Прочие символы
СимволНазваниеМнемоникаКод
«пики»&spades;&#9824;
«крести»&clubs;&#9827;
«червы»&hearts;&#9829;
«бубны»&diams;&#9830;
ромб&loz;&#9674;
крест&dagger;&#8224;
двойной крест&Dagger;&#8225;
ˆциркумфлекс&circ;&#710;
˜малая тильда&tilde;&#732;
́ударение (ставится после ударной гласной)&#769;
евро&euro;&#8364;
товарный знак&trade;&#8482;

Примечания:

  1. Если вместо некоторых символов вы видите Ѣ или □, значит ваш браузер не умеет их отображать.
  2. Нажмите на один из заголовков таблицы, чтобы отсортировать строки.

Блок-цитата HTML и другие HTML-кавычки

TL; DR — HTML-блок-цитаты и теги обычных кавычек окружают текст цитаты, предотвращая плагиат. Теги цитирования относятся к названию цитируемой работы.

Содержание
  • 1. Цитирование и цитирование в HTML
  • 2. Код цитирования HTML: используемые элементы
  • 3. Блок-цитирование HTML: сводка из написание контента на вашем сайте. Чтобы пометить фрагменты текста, которые цитируются или цитируются, мы используем несколько специальных элементов HTML:

    .
    Элемент Используется для Определяет
    Цитата Встроенная цитата
    <цитата> Цитата Котировка на уровне блока
    <цитировать> Цитата и цитата Название цитируемой/цитируемой работы

    При обучении написанию HTML-кода цитаты новички часто путаются в разнице между цитатой и цитатой . Это на самом деле очень просто: цитата использует точные слова автора, а цитата выражает свою мысль с помощью других слов.

    Pros

    • Простой дизайн (без лишней информации)
    • Качественные курсы (даже бесплатные)
    • Разнообразие функций

    Main Features

    • Nanodegree programs
    • Suitable for enterprises
    • Paid certificates of completion

    EXCLUSIVE: 75% OFF

    Pros

    • Easy to navigate
    • No technical issues
    • Seems заботиться о своих пользователях

    Основные характеристики

    • Большое разнообразие курсов
    • 30-дневная политика возврата средств
    • Бесплатные сертификаты об окончании

    до 12,99 $

    PROS

    • Great User Experience
    • предлагает качественное содержание
    • Очень прозрачные с их ценой

    Основные функции

    • Free Serciets of Completion . научные навыки
    • Гибкий график обучения

    СКИДКА 75%

    HTML-код цитаты: Элементы для использования

    Цитата, которую вы хотите включить в свой текст, должна быть вставлена ​​в теги . Они окружают встроенную кавычку в HTML 9.0018 кавычки автоматически:

    Пример

     Так много книг, так мало времени. - Фрэнк Заппа 

    Попробуйте вживую Учитесь на Udacity

    HTML-элемент

    отделяет цитату по-другому: отображается как блочный элемент с отступами:

    Пример

     

    Я обычный текст

    Цитата начинается здесь и заканчивается здесь
    а вот обычный текст снова

    Попробуйте в прямом эфире. Учитесь на Udacity

    Примечание. HTML-кавычки обычно используются для более длинных цитат.

    HTML-элемент определяет название работы, которую вы цитируете или цитируете. Содержимое этих тегов не заключено в кавычки HTML и обычно отображается курсивом:

    Пример

     Sophie's Choice Уильяма Стайрона 

    Попробуйте вживую, учитесь на Udacity

    HTML Blockquote: Summary

    • Элементы HTML могут быть вложенными . Обратите внимание на одинарные кавычки HTML, заключенные вокруг вложенного элемента:

    Пример

     Он пожал плечами: Ну, как однажды сказал Винни-Пух, я низкий, толстый и горжусь этим! 

    Попробуйте вживую Учитесь на Udacity

    • Блок-кавычки HTML также могут быть полезны в стиле , поскольку они помогают разбить поток вашей веб-страницы и разделить ее на разделы.
    • Вы также можете использовать блок-кавычки HTML, чтобы выделить цитат или отзывов .

    Curling Quotes в HTML, XML и SGML

    Curling Quotes в HTML, XML и SGML Дэвида А. Уилера

    Если вы создаете HTML, SGML и XML напрямую, возможно, с помощью текстового редактора или написания программы, самый безопасный подход — использовать «десятичные числовые ссылки на символы» для скручивания одинарных и двойных кавычек (эти знаки называются «умные цитаты», «кудрявые кавычки», «скрученные кавычки», «закругленные кавычки» или «изогнутые кавычки»). Другими словами, для левых и правых двойных кавычек используйте “ и ” — и для левые и правые одинарные кавычки (и апострофы), используйте ‘ и ’ — и вы будете рады, что сделали. Этот подход соответствует всем международным стандартам и работает по сути везде.

    Вот таблица, показывающая, что я имею в виду.

    Для отображения В HTML, SGML или XML используйте Отображается в вашей системе как
    Левая двойная кавычка »
    Правая двойная кавычка
    Левая одинарная кавычка
    Правая одинарная кавычка (включая английские притяжательные формы и сокращения)

    Благодаря этому ваш текст будет хорошо выглядеть на самых разных носителях. браузеры и средства просмотра, и вы можете легко вырезать и вставлять части данных между Документы HTML, SGML и XML (позволяют динамически запрашивать и создавать новые материал из существующего материала, без необходимости иметь дело со сложностями перевода между наборами символов).

    Если вы не хотите делать это напрямую, используйте инструменты, которые сделают это за вас. Если вы используете простые текстовые файлы ASCII, Нахал, выскочка, пижон может сделать это для вас.

    Лучшей альтернативой является использование UTF-8. UTF-8 великолепен, но другие кодировки все еще используются и могут вызывать проблемы.

    У этой конкретной рекомендации есть много преимуществ. Это официальные, стандартные, независимые от поставщиков кодировки для этих символы в соответствии с Unicode и ISO-10646, поэтому вам не нужно беспокоиться о том, что они не будут работать в будущем. Они также работают с XML, HTML и SGML, упрощая извлечение данных. альтернативы, такие как ссылки на именованные персонажи, делают не легко работать с XML и HTML (в частности). Системы, которые могут отображать закручивающиеся кавычки (с текущими шрифтами), будут это делать, и практически без исключения изящно вернется в нейтральное (вертикальное) положение. символы, если они не могут — даже если это несколько старый браузер. Я тестировал этот подход на нескольких версиях Internet Explorer, Netscape (старые 4.5 и 6.X), Mozilla (0.9.9 и 1.0), и lynx (текстовый браузер) в различных системах (Windows, Linux, Sun Solaris). Одна небольшая проблема заключается в том, что на некоторых старых системах X Windows с старые шрифты, левый одинарная кавычка может быть сопоставлена ​​с символом, расположенным под углом символ для правой одинарной кавычки — но выглядит неплохо, альтернативы везде выглядят гораздо хуже, и это решение является «заделом на будущее».

    Не используйте различные альтернативы:

    • Не используйте Ссылки на сущности символов HTML, назначенные для этой цели: “, ”, ‘ и ’. Ссылки на сущности символов не будут работать в SGML или XML в целом. потому что они не являются предопределенными объектами в SGML или XML. (дополнительную информацию см. в спецификации XML версии 1.0 для предопределенных сущностей). Информация). Они предопределены в современной реализации HTML, и вы можете определить их как в SGML, так и в XML, но это усложняет использовать фрагменты данных — если брать части материала, определения наверное не сойдется. тебе уверен, что ваша информация больше никогда не будет использована? Действительно, одним из основных преимуществ XML является то, что вы можете манипулировать результирующие данные, и использование этих удобств мешает этому процессу. Другая проблема заключается в том, что они не поддерживаются старыми браузерами. (например, Netscape 4.5) и инструменты, и помните, некоторым пользователям требуется много времени для обновления. Некоторые старые текстовые браузеры не поддерживают их — и текстовые браузеры важны для доступность, потому что они составляют основу большинства читателей для слепых. Также легко ошибиться со ссылками на сущности персонажей. более ранние версии этого документа неправильно использовали «lsquot» вместо «lsquo» (обратите внимание на лишнюю букву t). Если вы уверены, что никогда не будете использовать текст в SGML или XML, вы можете рассмотрите возможность использования этих символов через несколько лет, когда браузеры уйдут на пенсию, но оно того не стоит. Вам, вероятно, гораздо лучше следовать приведенной выше рекомендации; ваши данные будет проще объединить с другими данными (например, для создания динамических результатов), следуя этой рекомендации.
    • Не использовать HTML шестнадцатеричные числовые ссылки на символы, такие как “, ”, ‘ и ’. Шестнадцатеричные числовые ссылки удобны, потому что официальные документы, определяющие стандарты символов, также используют шестнадцатеричный формат. Однако поддержка шестнадцатеричной системы счисления — это недавняя функция с непоследовательной поддержкой: старые браузеры (например, Netscape 4. 5) не поддерживают его, и многие другие процессоры SGML и XML не поддерживают его. Действительно, SGML вообще не включает эту возможность. Поскольку они редко используются (по сравнению с десятичными версиями), с ними также выше риск столкнуться с ошибкой.
    • Не вставляйте символы UTF-8 (или UTF-16) непосредственно в текст и зависят от установки кодировки UTF-8 на данный момент. Например, для правая одинарная кавычка (включая английские притяжательные и сокращения), используйте ’ и не используйте кодировку UTF-8 11100010 10000000 10011001 (двоичный) ака e2 80 99 (шестнадцатеричный), также известный как 342 200 231 (восьмеричный), также известный как 226 128 153 (десятичный). UTF-8 — это фантастика, но она еще не универсальна, и проблема в том, что другие кодировки все еще используются. Кодировка UTF-8 не будет работать в некоторых текстовых браузерах (например, lynx и, следовательно, многие слепые читатели, которые зависят от рендеринга текста). В XML и HTML можно указать, что символы должны быть интерпретируется в соответствии с определенным набором символов (charset), но требование определенного набора символов имеет много недостатков. Установка кодировки на utf-8 работает во многих местах, но только если вы явно задали кодировку; неспособность установить кодировку приведет к сбою во многих системах. По сути, это затрудняет объединение вашего материала с другими источниками, потому что они, вероятно, будут использовать другие кодировки. Например, нестандартные наборы символов Microsoft (обсуждается далее). мешать ему, поэтому использование кодировки UTF-8 может вызвать проблемы при попытка объединения с данными из некоторых инструментов Microsoft и MacOS в некоторых обстоятельствах. В долгосрочной перспективе, надеюсь, все перейдут на UTF-8 и UTF-16, и тогда это будет разумной альтернативой. Пока не делайте этого.
    • Не используйте нестандартные наборы символов Microsoft (например, позиции со 145 по 148 для кодировки windows-1252). Они не только нестандартны, но и конфликт со стандартами — спецификация для HTML явно запрещается использование позиций символов от 128 до 159, потому что Unicode и ISO 10646 зарезервируйте позиции с 128 по 159 в качестве управляющих символов. Нестандартные символы Windows поддерживается не во всех браузерах и программах просмотра. На самом деле, их использование может вызвать проблемы, даже если все используют только продукты Майкрософт. Использование их вообще (даже в браузерах, которые их поддерживают) требует что вы установили «charset» к нестандартному значению (обычно windows-1252) в начале вашего документа. Если вы установите кодировку Windows-1252, она работает довольно широко, но это затрудняет объединение полученного текста с другими материал (поскольку нет гарантии, что ваш другой материал использует этот набор символов — используется много других наборов символов, даже если вы используете только продукты Microsoft). Таким образом, как и в случае со встроенным решением utf-8, этот подход усложняет комбинировать данные с другими источниками — если другой источник не использует тот же набор символов (очень вероятно!), он перестанет работать. Многие браузеры пытаются заставить их работать до тех пор, пока это конкретное установлена ​​кодировка, так как многие продукты Microsoft генерировать их, но это на ходу. .. даже с собственными продуктами Microsoft. Довольно странно, указание этих позиций кода Microsoft с помощью числовых идентификаторов часто работает на существующих системах, но делать это — полный провал по стандартам (они официально запрещено), поэтому полагаться на это довольно небезопасно. (W3C особо отмечает это.) Потому что есть несколько наборов символов Microsoft , такие вещи вызывают сложности в мире только Microsoft — вы можете легко иметь два файла, используя разных Microsoft наборы символов, которые не могут быть легко объединены. В статье Ларисы Томасон в NetMechanic отмечено то же самое — что даже в мире Microsoft эти символы вызывали проблемы. И помимо всего этого, Microsoft уже заявила, что движется к ISO 10646/Unicode, и уже изменили большую часть своего программного обеспечения сделать это, поэтому, даже если вы используете только продукты Microsoft, это не то место, где Сама Microsoft возглавляет. Microsoft называет их «умными кавычками», и люди часто жалуются насчет умных кавычек — проблема не в том, что Microsoft автоматически завивает кавычки по умолчанию (это нормально), но Microsoft использует эти нестандартные символы, которые мешают стандартам сделать это. Таким образом, этот подход проприетарный, он требует, чтобы вы установили нестандартную кодировку (которая делает это надежно сложнее и мешает слиянию текста), и Microsoft уже заявила, что вместо этого движется к ISO 10646, так что не делай этого.
    • На самом деле избегайте использования кодировок, если вы передаете английский документы. Существуют и другие наборы символов, такие как множество наборов символов Apple, но они вызывают бесконечные проблемы. Придерживаясь простого файла, состоящего только из символов ASCII, и используя десятичные числовые ссылки на символы для всех символов, отличных от ASCII, может занять немного больше места, но это полностью устраняет огромное количество проблем. Заставить систему правильно определять набор символов, пока он уже попытка прочитать файл проблематична, и существует огромное количество конфигураций настройки, которые могут пойти не так, а также клиентские системы, которые могут не справиться вещи правильно. UTF-8 по крайней мере означает одно и то же везде, так что вы есть надежда, если вы действительно хотите использовать набор символов, отличный от ASCII, и использовать УТФ-8. Но поскольку не все документы используют UTF-8 и другие кодировки (например, кодировки Windows) мешают им, придерживаясь подхода рекомендуемые здесь больше всего шансов на успех в HTML, SGML и XML.

    Теперь, почему это проблема? В нормальном английском языке используются совпадающие пары загнутых одинарных кавычек и двойных кавычек. указать цитату. К сожалению, оригинальные дизайнеры Набор символов ASCII не определял стандартный метод идентификации правильно изогнутые кавычки, поэтому у компьютеров были проблемы с правильно с тех пор обмениваемся кавычками.

    В книге Маркуса Куна «ASCII и кавычки Unicode» описывается вообще проблема ну. Он резюмирует так:

    Пожалуйста, не используйте гравировку ASCII (0x60), т.к. левая кавычка вместе с апострофом ASCII (0x27) как соответствующую правую кавычку. В противном случае ваш текст будет отображаться довольно странно с большинством современных шрифтов (например, в системах Windows и Mac). Только старые шрифты X Window System и некоторые старые видеотерминалы показать ASCII 0x60/0x27 как левые и правые кавычки, в то время как большинство современных систем вместо этого следуют стандартам ISO и Unicode. Если вы можете использовать только символы пишущей машинки ASCII, используйте символ апострофа (0x27) как левая, так и правая кавычки. Если вы можете использовать символы Unicode, хорошие кавычки направления доступны в форме символов U+2018 и U+2019.
    Есть интересное тестовая страница который проверяет некоторые символы. W3C есть страница по кодировкам символов.

    К сожалению, Кун не описывает, как конкретно бороться с проблема в HTML, XML и SGML, поэтому я написал эту страницу.

    Если вам интересно, вот текстовые страницы, которые я использовал для изучения проблемы на самых разных машинах:

    • Тестовая страница, кодировка UTF-8
    • Тестовая страница, кодировка по умолчанию
    • Тестовая страница, кодировка Windows-1252 (собственная и устаревшая)

    Обратите внимание, что этот подход означает, что если вы пытаетесь сгенерировать простой текст ASCII из HTML, SGML или XML, вам нужно будет перевести изогнутые кавычки в прямые кавычки. Но в целом это верно — если начать с более богатого набора символов (например, HTML, SGML или XML при использовании числовых ссылок на символы) и вам нужно перейти на более бедный набор символов, вы должны ожидайте, что некоторые символы нужно будет перевести. В любом случае вам придется обрабатывать много других символов, так что это это шаг, который вы должны были бы сделать в любом случае.

    После того, как я написал эту страницу, я обнаружил, что другие пришли к такому же выводу. (по тем же причинам). Например, Питер К. Ширин Проблема с EM ‘n EN предлагает такое же решение для многих те же причины (хотя проблем с SGML и XML он не отмечает, которые я тоже считаю важными). Он также обсуждает правильное использование длинное тире (—), которое используется для обозначения внезапного перерыва в мысли, короткое тире (–), которое используется для обозначения диапазона или связь между вещами, и один штрих (′), который используется для обозначения футов или минут. Опять же, решение состоит в том, чтобы использовать десятичные числовые ссылки на символы.

    Обратите внимание, что W3C рекомендует использовать такие escape-последовательности только в качестве исключения. Они предлагают использовать кодировку на основе Unicode (UTF-8, UTF-16 или UTF-32), а для XML — UTF-8 или UTF-16. Проблема в том, что мы все еще находимся в переходном периоде, когда инструменты не все так хорошо с ними справляются, и рекомендация, сделанная здесь будет работать ВСЕГДА (сейчас и в будущем).

    Если вам нужны подробные спецификации некоторых из них, вот несколько указателей: здесь Кодовая страница Microsoft Windows 1252 (Windows Latin 1), а также Кодовая страница Microsoft Windows 1253 (есть и другие). Краткое изложение доступна кодовая страница PalmOS. Возможно, что более важно, Вот несколько картографических документов, которые показывают, как преобразовать некоторые из эти кодировки символов в Unicode/ISO 10646: Microsoft Windows 1252 в Unicode, MacOS Roman в Unicode и вот набор отображений из различных кодировок в Unicode/ISO 10646.

    я делаю ПО с открытым исходным кодом / бесплатное ПО (OSS/FS) инструмент, цитата, доступная которая использует эвристику, чтобы попытаться исправить кавычки в HTML, XML или SGML (достаточно разумно оставить кавычки при использовании в тегах). Это бесплатно, так что не стесняйтесь использовать его (требуется Unix-подобная система или Cygwin в Windows).

    деморонизатор программа исправляет многие несовместимые знаки препинания Microsoft, чтобы они соответствуют стандартам, но, к сожалению, последняя версия, которую я видел (опубликовано 19 января98) преобразует только кавычки Microsoft в прямые кавычки ASCII вместо реализации подход описан здесь. Результаты деморонизатора, по крайней мере, выглядят лучше и более совместимы. чем ничего не делать, но они не так хороши, как подход рекомендуется здесь. Возможно, это имеет смысл; в январе 1998 года еще были какие-то старые инструменты, которые плохо обрабатывали кавычки, но в то время не нужно. Моя цитата инструмент лучше переводит кавычки; вы можете использовать demoroniser после использования цитаты если вы хотите исправить других персонажей.

    Composer, HTML-редактор в Mozilla и Netscape 6 (и более поздних версиях), обычно корректно редактирует файлы, содержащие закрученные кавычки, определенные таким образом. Другими словами, если они есть в файле, и вы редактируете файл, они будут в порядке. Однако, если вы установите значение Content-type в файле HTML, обязательно используйте такие настройки, как ascii или iso-8859-1. Вот пример кодов HTML, которые вы должны установить, если вы выберете установить Content-type (часто хорошая идея):

      
    Если вы установите другую кодировку, которая может представлять символы кавычек напрямую, например utf-8, Composer будет автоматически преобразовывать любые ссылки на числовые символы к этому набору символов. Это разумно для Composer, но может вызвать проблемы, когда вы попытаетесь объединить файлы позже (возможно, вам придется использовать различные инструменты преобразования). Вы также можете использовать Меню «Правка/Настройки» и выберите «Сохранить исходное форматирование». К сожалению, на момент написания этой статьи в Composer еще не было настройка предпочтений, позволяющая автоматически использовать закручивающиеся кавычки при нажатии кнопки прямой цитаты (возможность иногда называют «умными кавычками»), и его вставка/символы и символы возможность иметь скрученные кавычки в качестве опции. Я ввел предложение сделать это; пожалуйста посмотрите отчет об ошибке № 145765 и проголосуйте за добавление этой возможности. Таким образом, на данный момент, чтобы ввести закрученные кавычки в Composer вам нужно переключиться на просмотр исходного кода HTML; это работает, но медленно очень большие файлы. Альтернативой является обычное редактирование файлов, а затем использование таких инструментов, как мой инструмент цитаты, чтобы исправить вещи после редактирования.

    Plucker, начиная с версии 1.2, правильно обрабатывает эти кавычки.

    MacOS X Cocoa поддерживает закручивающиеся кавычки, ввод и отображение их, используя рекомендуемые здесь стандартные значения символов Unicode.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *