WikiDer > URL - Википедия

URL - Wikipedia

URL
Единый указатель ресурсов
Положение делОпубликовано
Впервые опубликовано1994; 26 лет назад (1994)
Последняя версияУровень жизни
2020
ОрганизацияИнженерная группа Интернета (IETF)
КомитетРабочая группа по технологиям веб-гипертекстовых приложений (WHATWG)
СерииЗапрос комментариев (RFC)
РедакторыЭнн ван Кестерен
АвторыТим Бернерс-Ли
Базовые стандартыRFC 3986. - Универсальный идентификатор ресурса (URI): общий синтаксис.

RFC 4248. - Схема telnet URI.
RFC 4266. - Схема URI суслика.
RFC 6068. - Схема URI «mailto».
RFC 6196. - Перемещение почтового сервера: Схема URI в Историческую.

RFC 6270. - Схема URI «tn3270».
Связанные стандартыURI, URN
ДоменВсемирная паутина
ЛицензияCC BY 4.0
СокращениеURL
Интернет сайтhttps://url.spec.whatwg.org

А Единый указатель ресурсов (URL), в просторечии называемый веб-адрес,[1] это ссылка на веб-ресурс который указывает его местоположение на компьютерная сеть и механизм для его получения. URL-адрес - это особый тип Единый идентификатор ресурса (URI),[2][3] хотя многие люди используют эти два термина как синонимы.[4][а] URL-адреса чаще всего используются для ссылки веб-страница (http), но также используются для передачи файлов (ftp), электронное письмо (mailto), доступ к базе данных (JDBC) и многие другие приложения.

Наиболее веб-браузеры отображать URL-адрес веб-страницы над страницей в Адресная строка. Типичный URL-адрес может иметь форму http://www.example.com/index.html, что указывает на протокол (http), а имя хоста (www.example.com) и имя файла (index.html).

История

Простой пример Uniform Resource Locator

Унифицированные указатели ресурсов были определены в RFC 1738 в 1994 г. Тим Бернерс-Ли, изобретатель Всемирная паутина, и рабочая группа URI Инженерная группа Интернета (IETF),[7] как результат сотрудничества, начатого в IETF Living Documents одного поля ягода сессия 1992 г.[8][9]

Формат объединяет ранее существовавшую систему доменные имена (создан в 1985 г.) с Путь файла синтаксис, где косые черты используются для разделения каталог и имена файлов. Уже существовали соглашения, согласно которым имена серверов могли быть дополнены префиксом для завершения пути к файлу, которому предшествовала двойная косая черта (//).[10]

Позднее Бернерс-Ли выразил сожаление по поводу использования точек для разделения частей доменное имя в URI, желая, чтобы он повсюду использовал слэши,[10] а также сказал, что, учитывая двоеточие после первого компонента URI, две косые черты перед доменным именем не нужны.[11]

Ранний (1993 г.) проект спецификации HTML[12] относится к «универсальным» локаторам ресурсов. Это было прекращено где-то между июнем 1994 г. (RFC1630) и октябрь 1994 г. (draft-ietf-uri-url-08.txt).[13]

Синтаксис

Каждый URL-адрес HTTP соответствует синтаксису универсального URI. В Общий синтаксис URI состоит из иерархической последовательности пяти составные части:[14]

URI = scheme: [// авторитет] путь [? Запрос] [# фрагмент]

где авторитетная составляющая делится на три подкомпоненты:

Authority = [userinfo @] host [: port]

Это представлено в синтаксическая диаграмма в качестве:

Схема синтаксиса URI

URI включает:

  • Непустой схема компонент, за которым следует двоеточие (:), состоящий из последовательности символов, начинающейся с буквы, за которой следует любая комбинация букв, цифр, плюс (+), период (.) или дефис (-). Хотя в схемах регистр не учитывается, в канонической форме используются строчные буквы, и в документах, определяющих схемы, должны использоваться строчные буквы. Примеры популярных схем включают http, https, ftp, mailto, файл, данные, и irc. Схемы URI должны быть зарегистрированы с Управление по присвоению номеров в Интернете (IANA), хотя на практике используются незарегистрированные схемы.[b]
  • Необязательный орган власти компонент, которому предшествуют две косые черты (//), включающий:
    • Необязательный userinfo подкомпонент, который может состоять из имя пользователя и необязательный пароль перед двоеточием (:), за которым следует символ at (@). Использование формата имя пользователя Пароль в подкомпоненте userinfo устарел по соображениям безопасности. Приложения не должны отображать в виде открытого текста любые данные после первого двоеточия (:) найденный в подкомпоненте userinfo, если данные после двоеточия не являются пустой строкой (указывающей на отсутствие пароля).
    • А хозяин подкомпонент, состоящий из зарегистрированного имени (включая, но не ограничиваясь, имя хоста) или айпи адрес. IPv4 адреса должны быть в точечно-десятичная запись, и IPv6 адреса должны быть заключены в скобки ([]).[16][c]
    • Необязательный порт подкомпонент, которому предшествует двоеточие (:).
  • А дорожка компонент, состоящий из последовательности сегментов пути, разделенных косой чертой (/). Путь всегда определяется для URI, хотя указанный путь может быть пустым (нулевой длины). Сегмент также может быть пустым, что приведет к двум последовательным косым чертам//) в компоненте пути. Компонент пути может напоминать или точно соответствовать путь к файловой системе, но не всегда подразумевает отношение к одному. Если присутствует компонент полномочий, то компонент пути должен быть пустым или начинаться с косой черты (/). Если компонент полномочий отсутствует, то путь не может начинаться с пустого сегмента, то есть с двух косых черт (//), поскольку следующие символы будут интерпретироваться как компонент полномочий.[18] Последний отрезок пути можно обозначить как 'слизняк'.
Разделитель запросаПример
Амперсанд (&)ключ1 = значение1 & ключ2 = значение2
Точка с запятой (;)[d]ключ1 = значение1; ключ2 = значение2
  • Необязательный запрос компонент, которому предшествует вопросительный знак (?), содержащий Строка запроса неиерархических данных. Его синтаксис не очень хорошо определен, но по соглашению чаще всего представляет собой последовательность пары атрибут – значение разделены разделитель.
  • Необязательный фрагмент компонент, которому предшествует хэш (#). Фрагмент содержит идентификатор фрагмента предоставление направления второстепенному ресурсу, например заголовку раздела в статье, определяемой оставшейся частью URI. Когда основным ресурсом является HTML документ, фрагмент часто я бы атрибут определенного элемента, и веб-браузеры прокрутят этот элемент в поле зрения.

Веб-браузер обычно разыменование URL, выполнив HTTP запрос на указанный хост, по умолчанию на порт номер 80. URL-адреса, использующие https схема требует, чтобы запросы и ответы производились через безопасное подключение к сайту.

Интернационализированный URL

Пользователи Интернета разбросаны по всему миру, использующие большое количество языков и алфавитов, и ожидают, что смогут создавать URL-адреса на своих собственных местных алфавитах. Интернационализированный идентификатор ресурса (IRI) - это форма URL-адреса, которая включает символы Unicode. Все современные браузеры поддерживают IRI. Части URL-адреса, требующие особой обработки для разных алфавитов, - это имя домена и путь.[20][21]

Доменное имя в IRI известно как Интернационализированное доменное имя (IDN). Программное обеспечение для Интернета и Интернета автоматически преобразует доменное имя в punycode может использоваться Системой доменных имен; например, китайский URL http: // 例子. 卷筒纸 становится http: //xn--fsqu00a.xn--3lr804guic/. В xn-- указывает, что символ изначально не был ASCII.[22]

Имя пути URL также может быть указано пользователем в локальной системе записи. Если он еще не закодирован, он преобразуется в UTF-8, и любые символы, не входящие в базовый набор символов URL, экранируются как шестнадцатеричный с помощью процентное кодирование; например, японский URL http://example.com/ 引 き 割 り .html становится http://example.com/%E5%BC%95%E3%81%8D%E5%89%B2%E3%82%8A.html. Целевой компьютер декодирует адрес и отображает страницу.[20]

URL-адреса, относящиеся к протоколу

Связанные с протоколом ссылки (PRL), также известные как URL-адреса, относящиеся к протоколу (PRURL), представляют собой URL-адреса, для которых протокол не указан. Например, //example.com будет использовать протокол текущей страницы, обычно HTTP или HTTPS.[23][24]

Смотрите также

Примечания

  1. ^ URL-адрес подразумевает средства доступа к указанному ресурсу и обозначается протоколом или механизмом доступа, что не относится к каждому URI.[5][4] Таким образом http://www.example.com - это URL, а www.example.com не является.[6]
  2. ^ Процедуры регистрации новых схем URI были первоначально определены в 1999 г. RFC 2717, и теперь определяются RFC7595, опубликовано в июне 2015 года.[15]
  3. ^ Для URI, относящихся к ресурсам в Интернете, некоторые веб-браузеры позволяют .0 части точечно-десятичной записи, которые необходимо отбросить, или необработанные целые IP-адреса, которые будут использоваться.[17]
  4. ^ Исторический RFC 1866 (устарело RFC2854) призывает авторов CGI поддерживать ';' в добавление к '&'.[19]

Цитаты

  1. ^ W3C (2009).
  2. ^ «Прямая и обратная косая черта в URL-адресах». zzz.buzz. Получено 2018-09-19.
  3. ^ RFC 3986 (2005).
  4. ^ а б Совместная группа W3C / IETF по планированию URI (2002).
  5. ^ RFC 2396 (1998).
  6. ^ Мисслер, Даниэль. «Разница между URL-адресами и URI».
  7. ^ W3C (1994).
  8. ^ IETF (1992).
  9. ^ Бернерс-Ли (1994).
  10. ^ а б Бернерс-Ли (2000).
  11. ^ BBC News (2009).
  12. ^ Бернерс-Ли, Тим; Коннолли, Дэниел "Дэн" (Март 1993 г.). Язык разметки гипертекста (проект RFCxxx) (Технический отчет). п. 28.
  13. ^ Бернерс-Ли, Тим; Масинтер, Ларри; МакКахилл, Марк Перри (Октябрь 1994 г.). Унифицированные указатели ресурсов (URL) (Технический отчет). цитируется в Ang, C. S .; Мартин, Д. К. (январь 1995 г.). Составной компонентный интерфейс ++ (Технический отчет). Библиотека UCSF и Центр управления знаниями.
  14. ^ RFC 3986, раздел 3 (2005).
  15. ^ IETF (2015).
  16. ^ RFC 3986 (2005), §3.2.2.
  17. ^ Лоуренс (2014).
  18. ^ RFC 2396 (1998), §3.3.
  19. ^ RFC 1866 (1995), §8.2.1.
  20. ^ а б W3C (2008).
  21. ^ W3C (2014).
  22. ^ IANA (2003 г.).
  23. ^ Глейзер, Дж. Д. (2013). Безопасная разработка мобильных приложений: как разрабатывать и кодировать безопасные мобильные приложения с помощью PHP и JavaScript. CRC Press. п. 193. ISBN 978-1-48220903-7. Получено 2015-10-12.
  24. ^ Шафер, Стивен М. (2011). HTML, XHTML и CSS Библия. Джон Уайли и сыновья. п. 124. ISBN 978-1-11808130-3. Получено 2015-10-12.

Рекомендации

внешняя ссылка