Правильные названия URL — оптимизация своими руками.
Одним из ключевых моментов в продвижении сайта является правильное название URL, от которого так же будут зависеть ваши позиции при выдаче в поисковой системе. В данной статье мы научимся правильно называть наши url адреса, также разберем какие слова нужно использовать в названиях.
Мы уже немного затронули момент связанный с поисковой оптимизацией, по этому сначала разберем суть и важность правильного названия url, а затем уж пойдем дальше.
Как URL влияет на позиции в поисковых системах?
Для того что бы понять суть влияния url на позиции при выдаче в поиске давайте рассмотрим картинку ниже и разберем ее суть.
Данная выдача была сделана поисковой системой Google на запрос «Банан»:
Как мы видим по результатам поиска нам выдало ряд сайтов. Что выдает поисковая система? Это наш заголовок ссылка на страницу, url адрес сайта и статьи, фрагмент текста или сниппет.
С заголовком я думаю все понятно, мы размещаем в него те фразы по которым мы хотим продвигаться в первую очередь.
Нас интересует непосредственно url адрес. Как мы можем убедиться в ТОП 5 выдачи находятся сайты в которых в url находятся ключевые слова, они подсвечены, а значит участвовали в результатах выдачи.
Другими словами на позицию сайта влияет размещения в url адресе ключевых слов по нашей статье, это один из ключевых факторов, о которых забывать нельзя.
Как выбрать правильный URL адрес?
Для того что бы выбрать правильный url адрес для вашей страницы сайта, нужно определиться по какому главному ключевому слову вы будете продвигаться.
Точное вхождение ключевого слова в url принесет вам колоссальный успех, естественно при условии что все остальные критерии написания оптимальной статьи были выполнены правильно.
Если у вас интернет магазин тогда лучше всего внести название товара в url, если же вы пишите обычный блог тогда вхождение названия статьи или главной фразы будет именно тем правильным названием url.
Что такое ЧПУ (человекопонятный url)?
Человекопонятный адрес — это адрес, который сможет прочитать потенциальный посетитель и понять тематику страницы.
В предыдущем разделе мы научились выбирать правильный url адрес для сайта. Именно хорошо читаемый url адрес и является ЧПУ.
Далее мы рассмотрим внедрение ЧПУ на сайте WordPress.
Как настроить ЧПУ на сайте WordPress?
Для того что бы настроить человекопонятный адрес в WordPress нужно перейти из административной панели WordPress в меню «Настройки»/»Постоянные ссылки».
В форме предложенной для выбора шаблона url нужно выбрать «Название записи». Которая будет автоматически прикреплена к вашему url адресу после создания страницы или записи WordPress.
С названием определились, выставили ЧПУ для WordPress сайта, теперь постараемся писать наши названия на транслитерации (русские слова латинскими буквами) правильно.
Как правильно написать русское слово латинскими буквами?
Для того что бы правильно провести транслитерацию можно воспользоваться следующими методами перевода:
- Воспользоваться онлайн сервисом для перевода русских слов на латиницу.
- Самостоятельно перевести слово.
- Плагин для транслитерации на WordPress.
Сайты для онлайн транслитерации слов
Существует немало сайтов в интернете, которые предлагают транслитерацию слов абсолютно бесплатно и быстро.
Ниже приведем пример нескольких из них:
- fotosav.ru/services/transliteration.aspx на данном сайте все очень просто, вводим слово на русском и получаем перевод на латинице.
- kakvse.net/translit.html так же качественно переведет ваши слова.
Этих двух сайтов будет вам вполне достаточно для перевода русских слов на транслит.
Самостоятельный перевод слов на латиницу
Вполне реально проводить транслитерацию самостоятельно, для этого достаточно понимать буквы аналоги с латиницей, ознакомиться с таблицей транслитерации можно в данной таблице взятой с сайта egold-money.info.
Использование плагина для транслитерации на WordPress
Существует один очень удобный плагин для автоматического перевода русских url на латиницу WordPress. Название плагина Cyr to Lat enhanced.
Данный плагин относиться к разряду «Установил и забыл», он переведет все ссылки в ваших страницах и статьях автоматически без каких либо дополнительных настроек, замете только то что если ваши ссылки уже проиндексированы то у вас может случиться некий курьез с поисковиками которым потребуется время добавить новую ссылку и удалить старую, в лучшем варианте удалять ссылки лучше самостоятельно в вебмастерах поисковых систем.
Хотя плагин и прост и весит мало, все же не советую его использовать, по причине того что достаточно легко справиться с задачей по транслитерации и назначению правильного url самостоятельно без сторонних модулей.
В заключение: используйте правильные названия и ЧПУ (человекопонятные урлы) для продвижения вашего сайта в поисковой системе. Переводить русские слова лучше самостоятельно без использования дополнений, которые замедляют ваш WordPress.
Рекомендую почитать:
10 правил оптимизации URL адресов страниц
Правильная оптимизация URL
О том, что внутренняя оптимизация сайта должна быть на высшем уровне Вы, конечно же, не раз слышали ранее. Ведь об этом неустанно твердят все веб-сайты о SEO, в том числе и наш.
В этом материале мы не станем повторяться и еще раз рассказывать об оптимизированных title, description, заголовках страниц и т. д.
Сегодня мы хотим Вам рассказать об одном довольно редко упоминаемом моменте – о том, что правильно составленный URL страницы является не менее важным показателем ее релевантности и фактором, который охотно учитывается при ранжировании поисковых выдач.
К сожалению, довольно существенная часть вебмастеров забывает или, возможно, даже не знает, как правильно прописывать URL страниц. Многие привыкли полагаться на автоматические функции используемых CMS, которые в большинстве случаев делают это неправильно.
Эта статья однозначно Вам пригодится, если на Вашем сайте адреса страничек выглядят примерно вот так:
Немного теории: что такое URL?
В дословном переводе URL (англ. Uniform Resource Locator) – это унифицированный адрес ресурса.
Если более простыми словами, то – это стандартизированный способ записи расположения (адресов) всех существующих интернет-ресурсов (файлов, страниц, веб-сайтов).
Полный адрес всегда начинается с сетевого протокола. Например, протокол https или чаще всего http. Хотя существует еще около 30 реже используемых разновидностей (ftp, irc, xmpp и т. п.).
В большинстве современных браузеров http опускается. Убедиться, что перед Вами правильно составленный URL можно, если скопировать и вставить его куда-нибудь.
Далее, за протоколом передачи данных следует домен и конкретный путь к интернет-ресурсу (к файлу или страничке). И вот именно с правильного прописывания этого пути и состоит оптимизация URL.
Как прописать URL адрес страницы правильно
- Правильно составленный URL должен содержать ключевые слова. Кроме того, что выбранное доменное имя для продвижения является очень важным и должно содержать основной ключевой запрос сайта, в адрес каждой странички также нужно включать запрос, по которому она продвигается.
И это будут учитывать не только поисковики.
Совпадения по введенному в поисковую строку запросу выделяются жирным не только в названии и описании сайта, но и в адресе. Поэтому если правильно написать URL, интернет-пользователи также будут обращать внимание на него в результатах поиска и будут учитывать во время формирования своего мнения о релевантности страницы и возможности перехода на нее.
- Оптимизация URL страниц, с точки зрения SEO, предполагает использование в адресе не более 3–5 слов. Длинные ссылки не отображаются полностью в выдаче (обрезаются) и снижают вес ключевых слов в глазах поисковиков.
- Не стоит использовать слишком глубокий уровень вложенности страниц. Даже если страничка находится в пяти–шести шагах от главной, желательно правильно прописывать URL – убирать из адресов излишние упоминания о категория, рубриках и т. д.
Повышенное количество уровней вложенности в URL не только увеличивает его длину и уменьшает вес ключевиков, но также плохо влияет на восприятие образовавшегося адреса посетителями. В нем сложно разобраться и его практически невозможно запомнить.
- Существуют рекомендации по поводу того, что наиболее правильно прописывать URL с расширением файла в конце («.html», «.php» и т.п.). Хотя такое утверждение является довольно спорным, поскольку для поисковиков это наверняка неважно. Разве что человеку становится понятно, что страница, на которой он находится – это конечный пункт и глубже перейти нельзя.
- Для того чтобы прописать URL адрес страницы, состоящий более, чем из одного слова, в роли разделителей лучше использовать дефисы, а не нижние подчеркивания. В то время как у Google с их распознаванием все в порядке, для Яндекса дефисы все еще предпочтительнее.
- Правильно составленный URL должен содержать только символы, прописанные в нижнем регистре. Если этой рекомендации не придерживаться, могут быть проблемы с индексацией страничек.
- Использование кириллических символов допустимо, но нежелательно. Поскольку они только визуально отображаются в адресной строке в таком же виде, как вы захотите прописать URL адрес страницы. На самом же деле каждая русская буква перекодировывается в виде шести символов.
Поэтому в SEO, чтобы иметь правильно составленный URL, рекомендовано пользоваться только латинскими символами и цифрами в адресах страничек.
- Под оптимизацией URL также подразумевается наличие только одного адреса у каждой страницы. Если имеется проблема с автоматическим генерированием, дубли страниц нужно закрывать от индексации и использовать атрибут rel=«canonical» для указания канонических версий.
- Правильно написать URL несложно, но при этом нужно не забывать, что ключевые слова в нем учитываются при оценке частности их использования. То есть если на странице (в тексте и заголовках) у Вас встречается поисковый запрос 8 раз и это является предельно допустимым количеством в конкретном случае, то 9-й раз в адресе будет уже явным пересмамом. Следовательно в тексте нужно использовать ключ на 1 раз меньше.
- Необязательно правильно прописывать URL вручную. Например, в WordPress можно настроить автоматическое формирование адреса создаваемой странички путем транслитерирования используемого заголовка h2 с помощью плагина Cyr-To-Lat.
Правильно составленный URL – не панацея
Не стоит надеяться, что лишь оптимизация URL согласно вышеперечисленных рекомендаций сразу же поднимет странички Вашего веб-сайта в ТОП.
Помните, что это лишь один из элементов, влияющих на поисковое продвижение.
Поэтому позаботьтесь о том, чтобы у каждой страницы Вашего сайта всегда был правильно составленный URL и продолжайте работать во всех остальных направлениях оптимизации, которыми изобилует SEO!
Что такое URL адрес сайта? Параметры, допустимые символы URL
Параметры и допустимые символы URL адреса сайта
В одной из предыдущих статей я описывал человеко-понятные урл — ЧПУ URL и разное отношение поисковиков к ним. В данной статье хотелось бы рассмотреть само понятие УРЛ, так как оно является основополагающим для всего Интернета.
URL (Uniform Resource Locator) — переводится с английского как Унифицированный указатель ресурса, или Единообразный (универсальный) локатор ресурса, т.е. это путь, по которому можно найти любой файл и каталог в сети Интернет.
URL адрес страницы сайта состоит из следующих элементов: протокол://полное доменное имя/(папка(и))/имя ресурса (файла). В расширенном варианте УРЛ может выглядеть так:
схема://логин:пароль@хост:порт/(папка(и))/имя ресурса (файла)?параметры#якорь
Основные параметры Урл:
- в качестве схемы выступает обычно какой-нибудь протокол, обычно это http(s), ftp и множество других (skype, nfs)
- логин-пароль нужны для прохождения одного из способов авторизации пользователя на сервере. Если авторизации не требуется, эти параметры не указываются
- хост — полное доменное имя или IP-адрес компьютера в сети. Например, для Яндекса — это Yandex.ru
- порт — на каком порту сервера будет производиться подключение к нему. В большинстве случаев, данный параметр не указывается, т.к. по умолчанию подразумевается порт 80, которым обычно пользуются браузеры. Попробуйте к любому URL адресу сайта подставить «:80», ничего нового не произойдёт — будет совершён переход на адрес «без порта». Например http://www.google.ru:80 перекинет на http://www.google.ru.
- далее идёт или сразу имя файла (например, page.php), или сначала 1 и более каталогов, а потом имя файла. Если имя файла отсутствует, то открывается т.н. индексный файл — index.php (index.html, index.jsp и множество других расширений).
- после имени файла могут указываться дополнительные параметры — после знака вопроса (?). Между параметрами ставится знак амперсанда (&). К примеру, выглядеть это может так: http://www.bing.com/account/web?sh=5&ru=%2f. Самих параметров может быть много, они имеют вид переменная=значение и обрабатываются на сервере с помощью языков серверного программирования
- якорь в URL подставляется после решётки (#) и указывает на элемент открываемой страницы, причём браузер обычно автоматически производит прокрутку до того html-элемента, id которого равно якорю. Например, на созданных на WordPress сайтах при клике на «Читать далее»как раз это и происходит:
Пример из WordPress’а
Допустимые символы URL
В URL адресе допустимы только латинские буквы, арабские цифры и ограниченный набор знаков препинания:
- дефис (-),
- подчёркивание (_)
- точка (.)
Также возможны запятые (,) и точки с запятой (;), но используются они редко и обычно кодируются, как и все остальные символы (русские буквы, пробелы и т.п.). Яркий пример закодированных урл’ов — статьи Википедии — http://ru.wikipedia.org/wiki/%D0%95%D0%B6.
Правила кодирования нелатинских букв (в т.ч. кириллицы) и прочих не допустимых символов URL: сначала буква кодируется в UTF-8 (кодировку Unicode) — получается 2 байта из каждого символа. Затем каждый из этих байтов преобразуется в шестнадцатиричную систему счисления и перед ним ставится знак процента (%), получается что-нибудь такое: %D0%95%D0%B6 (по-русски будет «еж»). Недопустимые знаки препинания кодируются так:
Кодирование символов в адресах. Справка из Википедии (кликабельно)
Среди УРЛ выделяют относительные и абсолютные, а также статические и динамические URL адреса страниц сайта. Об этом будет рассказано в следующих статьях.
Правильный URL-текст: как оптимизировать URL-адрес страницы
Мы увеличиваем посещаемость и позиции в выдаче. Вы получаете продажи и платите только за реальный результат, только за целевые переходы из поисковых систем
Получи нашу книгу «Контент-маркетинг в социальных сетях: Как засесть в голову подписчиков и влюбить их в свой бренд».
Подпишись на рассылку и получи книгу в подарок!
Для многих URL — просто уникальная ссылка, которая используется для записи адреса ресурса в Интернете. Для SEO специалиста URL содержит гораздо больше информации, чем просто расположение. Урл помогает поисковым системам понять содержание страницы, ее цель, а также целевую аудиторию. Ниже приведены 10 самых важных рекомендаций по оптимизации URL.
10. URL текст должен быть на 100% читабельным
Если вы не можете разобрать текст URL, то и поисковик не сможет. Поисковые системы знают, что многие пользователи читают урл, прежде чем кликнуть по нему, поэтому стремятся помочь человеку понять содержание страницы.
Поисковые роботы не могут расшифровать сумасбродные дурацкие адреса, они даже не пытаются. Вместо этого они просто читают слова в URL, так же, как и контент вашей страницы.
Если бы вы хотели купить розовые пушистые тапочки, на какой URL вы бы кликнули?
Прежде всего, оптимизировать url адреса страницы необходимо для удобства пользователей.
9. Только дефис
Если вы хотите отделить слова в URL страницы, к примеру, все тех же розовых пушистых тапочек, то используйте дефис (никак не подчеркивание или плюсик). Google очень доступно объяснял этот момент: в поисковом алгоритме было прописано читать дефис, а не подчеркивания. Если вы хотите заполучить высокий рейтинг в крупнейшей поисковой системе в мире, вы должны играть по их правилам.
8. Правильная структура при оптимизации урла
Структура URL сообщает о важности страницы на вашем сайте. Нужно организовывать контент сайта таким образом, чтобы URL текст имел логическую структуру и был более понятен для пользователя.
7. Никаких заглавных букв!
Чтобы использовать заглавную букву в URL (текст ссылки) у вас должна быть очень веская причина. Заглавные буквы просто путают всех ( и людей, и поисковиков). Обратите внимание на этот пример:
Поисковик считает, что это 2 разные страницы, имеющие одинаковое содержание. Так и формируется злополучный дубль.
6. Блокируйте дубли в robots.txt
Чтобы не получить пинка от поисковиков за дублированный контент, скройте от индексации все урлы страниц с повторяющимся содержанием. К примеру, ваш движок может создать несколько урлов, если вы разместите один пост сразу в нескольких разделах. Полный гайд по дублям и их обнаружению можно прочить здесь.
5. Добавьте информацию об URL для мобильных устройств в карту сайта
Расскажите поисковым системам о том, что ваша страница оптимизирована под мобильные устройства. Mobile friendly, как правило, сказывается на результатах мобильного поиска.
Некоторые люди говорят, что не нужно указывать “мобильную дружелюбность” урла страницы, если сайт и так оптимизирован. Но чтобы перестраховаться в оптимизации url, советуем указать в карте сайта этот момент.
Вот рекомендация Google о том, как добавить информацию об URL для мобильных устройств в файл Sitemap.
4. При оптимизации url используйте канонические URL-адреса
Динамические страницы иногда могут случайно создать дубликат контента, иногда вы делаете это специально (копируйте, к примеру, текст с главной в свои группы в соцсетях). Так вот, если вы не хотите стать нарушителем, то можно использовать канонические URL.
Динамический контент
Если вы хотите чтобы ваш http://site.ru/rozovye-pushistye-tapochki был основным URL, даже если есть другие URL-адреса с таким же содержанием, тогда добавьте в раздел head элемент link c атрибутом rel= «canonical» в каждую страницу с одинаковым содержанием.
После этого поисковики будут индексировать только http://site.ru/rozovye-pushistye-tapochki
Пример атрибута rel= «canonical»:
<link rel="canonical" href="http://site.ru/rozovye-pushistye-tapochki"/>
Редирект
Как мы уже говорили, поисковики считают site.ru и www.site.ru двумя разными страницами. Чтобы исправить это, установите редирект, который будет перенаправлять пользователей и поисковики на ваш главный домен.
Подробнее о редиректах здесь.
Канонизировать ваш IP
Это еще один способ избежать наказания за дублированный контент. Просто перенаправьте IP-адрес на ваш основной домен. В противном случае поисковые системы могут подумать, что ваш IP-адрес и ваш веб-сайт — два различных сайта с одинаковым содержанием.
Сообщите Google и другим поисковым системам, когда игнорировать любые параметры, добавленные в URL, такие как ID сессии или пагинация. Делая это, вы говорите поисковикам, что http://site.ru/cliuchevoe-slovo?sessionid=54 содержит тот же контент, что и http://site.ru/cliuchevoe-slovo.
Чтобы оптимизировать URL-адрес страницы попробуйте использовать инструмент Параметры URL в Google Webmaster Tools.
3. Загрузите Favicon
Крошечный значок рядом с вашим URL в браузере называется Favicon.
Фавикон дает вам некоторые преимущества. Во-первых, повышает узнаваемость вашего веб-ресурса, ведь многие пользователи лучше запоминают картинку, чем название сайта. Кстати, именно по этой причине многие компании используют свой логотип в качестве иконки. Во-вторых, способствует увеличению показателей кликабельности, тем самым привлекая трафик.
Конечно, напрямую фавикон не влияет на оптимизацию URL, но определенная корреляция все же есть. В целом лучше добавить favicon на свой сайт.
2. 301 редирект
Если по какой-либо причине вам необходимо изменить URL, то запомните раз и навсегда: тем самым вы удаляете страницу, которая была уже проиндексирована и на которую, возможно, ссылались другие сайты.
Вы же не хотите, чтобы поисковые системы удалили страницу, которая была в топе, из результатов поиска по причине не того, что не смогут найти контент по старому адресу. Просто сообщите поисковым системам, добавив 301 редирект со старого URL на новый URL-адрес.
1. При оптимизации URL-адреса страницы впишите ключевое слово
При возможности, добавьте ключевое слово или фразу в свой URL-адрес. Это, как правило, трудно реализовать на главной, но вполне возможно на страницах услуг или в блоге.
Предположим, что вы продвигаете сайт по запросу «пушистые розовые тапочки»:
Полезно? Сохрани!
Источник.
URI — Википедия
URI (/ˌjuː ɑːr ˈaɪ/ англ. Uniform Resource Identifier) — унифицированный (единообразный) идентификатор ресурса. По-русски иногда говорят [у́ри]. URI — последовательность символов, идентифицирующая абстрактный или физический ресурс. Ранее назывался Universal Resource Identifier — универсальный идентификатор ресурса.
URI — символьная строка, позволяющая идентифицировать какой-либо ресурс: документ, изображение, файл, службу, ящик электронной почты и т. д. Прежде всего, речь идёт о ресурсах сети Интернет и Всемирной паутины. URI предоставляет простой и расширяемый способ идентификации ресурсов. Расширяемость URI означает, что уже существуют несколько схем идентификации внутри URI, и ещё больше будет создано в будущем.
URI является либо URL, либо URN, либо одновременно обоими.
URL — это URI, который, помимо идентификации ресурса, предоставляет ещё и информацию о местонахождении этого ресурса. А URN — это URI, который только идентифицирует ресурс в определённом пространстве имён (и, соответственно, в определённом контексте), но не указывает его местонахождение. Например, URN urn:ISBN:0-395-36341-1 — это URI, который указывает на ресурс (книгу) 0-395-36341-1 в пространстве имён ISBN, но, в отличие от URL, URN не указывает на местонахождение этого ресурса: в нём не сказано, в каком магазине её можно купить или на каком сайте скачать. Впрочем, в последнее время появилась тенденция говорить просто URI о любой строке-идентификаторе, без дальнейших уточнений. Так что, возможно, термины URL и URN скоро уйдут в прошлое.
Поскольку URI не всегда указывает на то, как получить ресурс, в отличие от URL, а только идентифицирует его, это даёт возможность описывать с помощью RDF (Resource Description Framework) ресурсы, которые не могут быть получены через Интернет (например, личность, автомобиль, город и проч.).
В 1990 году в Женеве, Швейцария, в стенах Европейского совета по ядерным исследованиям (фр. Conseil Européen pour la Recherche Nucléaire, CERN) британским учёным Тимом Бернерсом-Ли был изобретён определитель местонахождения ресурса URL. Так как URL является наиболее используемым подмножеством URI, то этот же 1990 год принято считать годом рождения URI. Но, строго говоря, концепция URI была документально оформлена лишь в июне 1994 года в документе RFC 1630.
Новая версия URI была определена в 1998 году в RFC 2396, тогда же слово Universal в названии было заменено на Uniform. В декабре 1999 года RFC 2732 ввёл в спецификацию URI небольшие изменения, обеспечив совместимость с IPv6. В августе 2002 года RFC 3305 анонсировал устаревание термина URL и приоритет URI. Текущая структура и синтаксис URI регулируется стандартом RFC 3986, вышедшим в январе 2005 года. Многие новейшие технологии семантической паутины (например, RDF) базируются на стандарте URI. Сейчас ведущая роль в развитии URI принадлежит Консорциуму Всемирной паутины.
URL стал фундаментальным нововведением в Интернете, поэтому принципы URI документально закреплялись так, чтобы обеспечить полную совместимость с URL. Отсюда появился и большой недостаток URI, пришедший как наследство от URL. В URI, как и в URL, можно использовать только ограниченный набор латинских символов и знаков препинания (даже меньший, нежели в ASCII). Иными словами, если мы захотим использовать в URI символы кириллицы, или иероглифы, или, скажем, специфические символы французского языка, то нам придётся кодировать URI таким же образом, каким в Википедии кодируются URL с символами Юникода. Например, строка вида:
https://ru.wikipedia.org/wiki/Кириллица
кодируется в URL как:
https://ru.wikipedia.org/wiki/%D0%9A%D0%B8%D1%80%D0%B8%D0%BB%D0%BB%D0%B8%D1%86%D0%B0
Поскольку такому преобразованию подвергаются буквы всех алфавитов, кроме используемой в английском языке латиницы, то URI со словами на других языках (даже европейских) утрачивают способность восприниматься людьми. А это входит в грубое противоречие с принципом интернационализма, провозглашаемого всеми ведущими организациями Интернета, включая W3C и ISOC. Эту проблему призван решить стандарт IRI (англ. Internationalized Resource Identifier) — международных идентификаторов ресурсов, в которых можно было бы без проблем использовать символы Юникода, и которые не ущемляли бы права других языков. Хотя заранее сложно сказать, смогут ли когда-либо идентификаторы IRI заменить URI, имеющие столь широкое употребление.
Ещё одной интересной вариацией URI является расширяемый идентификатор ресурса XRI (англ. Extensible Resource Identifier), разработанный организацией OASIS. Этот формат стремится создавать идентификаторы, которые были бы совершенно независимы от контекста, то есть не зависели бы ни от протокола, ни от домена, ни от пути, ни от приложения, ни от платформы — были бы совершенно независимыми.
Также и сам создатель URI, Тим Бернерс-Ли, говорил, что система доменных имён, лежащая в основе URL, — плохое решение, навязывающее ресурсам иерархическую архитектуру, мало подходящую для гипертекстового веба.
URI = [ схема ":" ] иерархическая-часть [ "?" запрос ] [ "#" фрагмент ]
В этой записи:
- схема
- схема обращения к ресурсу (часто указывает на сетевой протокол), например http, ftp, file, ldap, mailto, urn
- иерархическая-часть
- содержит данные, обычно организованные в иерархической форме, которые, совместно с данными в неиерархическом компоненте запрос, служат для идентификации ресурса в пределах видимости URI-схемы. Обычно иер-часть содержит путь к ресурсу (и, возможно, перед ним, адрес сервера, на котором тот располагается) или идентификатор ресурса (в случае URN).
- запрос
- этот необязательный компонент URI описан выше.
- фрагмент
- (тоже необязательный компонент)
RFC 3986:
позволяет косвенно идентифицировать вторичный ресурс посредством ссылки на первичный и указанием дополнительной информации. Вторичный идентифицируемый ресурс может быть некоторой частью или подмножеством первичного, некоторым его представлением или другим ресурсом, определённым или описанным таким ресурсом.
Оригинальный текст (англ.)
The fragment identifier component of a URI allows indirect identification of a secondary resource by reference to a primary resource and additional identifying information. The identified secondary resource may be some portion or subset of the primary resource, some view on representations of the primary resource, or some other resource defined or described by those representations.
Часть идентификатора URI без схемы обращения к ресурсу часто называется «ссылкой URI» (англ. URI reference). Прецеденты применения ссылок URI имеются в HTML, XHTML, XML и XSLT. Процесс превращения ссылки URI в абсолютную форму URI называют «разрешением URI» (англ. URI resolution).
Процесс разработки новых схем описан в документе RFC 2718. Новые схемы должны регистрироваться в организации IANA (англ. Internet Assigned Numbers Authority), процедура регистрации зафиксирована в RFC 2717. Оба указанных запроса комментариев (RFC) сейчас находятся в процессе переработки.
Разбор структуры URI[править | править код]
Для так называемого «па́рсинга» URI (англ. parsing), то есть для разложения URI на составные части и их последующей идентификации, удобнее всего использовать систему регулярных выражений, доступную почти во всех современных языках программирования. Для разбора URI в стандарте RFC 3986 рекомендуется использовать следующий шаблон:
^(([^:/?#]+):)?(//([^/?#]*))?([^?#]*)(\?([^#]*))?(#(.*))? 12 3 4 5 6 7 8 9
Этот шаблон включает в себя 9 обозначенных выше цифрами групп (подробнее о шаблонах и группах см. Регулярные выражения), которые наиболее полно и точно разбирают типичную структуру URI, где:
- группа 2 — схема,
- группа 4 — источник,
- группа 5 — путь,
- группа 7 — запрос,
- группа 9 — фрагмент.
Таким образом, если при помощи данного шаблона разобрать, например, такой типичный идентификатор URI:
http://www.ics.uci.edu/pub/ietf/uri/#Related
то 9 вышеуказанных групп шаблона дадут следующие результаты соответственно:
- http:
- http
- //www.ics.uci.edu
- www.ics.uci.edu
- /pub/ietf/uri/
- нет результата
- нет результата
- #Related
- Related
Абсолютные URI[править | править код]
- https://ru.wikipedia.org/wiki/URI
- ftp://ftp.is.co.za/rfc/rfc1808.txt
- file://C:\UserName.HostName\Projects\Wikipedia_Articles\URI.xml
- file:///C:/file.wsdl
- file:///Users/John/Documents/Projects/Web/MyWebsite/about.html
- ldap://[2001:db8::7]/c=GB?objectClass?one
- mailto:[email protected]
- sip:[email protected]
- news:comp.infosystems.www.servers.unix
- data:text/plain;charset=iso-8859-7,%be%be%be
- tel:+1-816-555-1212
- telnet://192.0.2.16:80/
- urn:oasis:names:specification:docbook:dtd:xml:4.1.2
- urn:oid:1.2.840.113549.1.1.1
Относительные URI[править | править код]
/relative/URI/with/absolute/path/to/resource.txt
//example.org/scheme-relative/URI/with/absolute/path/to/resource.txt
relative/path/to/resource.txt
../../../resource.txt
resource.txt
/resource.txt#frag01
#frag01
[пустая строка] — эквивалентно разбору идентификатора парсером с результатом [пустая строка], то есть ссылка ведёт на объект по умолчанию в схеме по умолчанию[источник не указан 3175 дней]