WikiDer > URL - Википедия
Единый указатель ресурсов | |
Положение дел | Опубликовано |
---|---|
Впервые опубликовано | 1994 |
Последняя версия | Уровень жизни 2020 |
Организация | Инженерная группа Интернета (IETF) |
Комитет | Рабочая группа по технологиям веб-гипертекстовых приложений (WHATWG) |
Серии | Запрос комментариев (RFC) |
Редакторы | Энн ван Кестерен |
Авторы | Тим Бернерс-Ли |
Базовые стандарты | RFC 3986. - Универсальный идентификатор ресурса (URI): общий синтаксис. RFC 4248. - Схема telnet URI. |
Связанные стандарты | URI, URN |
Домен | Всемирная паутина |
Лицензия | CC BY 4.0 |
Сокращение | URL |
Интернет сайт | https://url.spec.whatwg.org |
А Единый указатель ресурсов (URL), в просторечии называемый веб-адрес,[1] это ссылка на веб-ресурс который указывает его местоположение на компьютерная сеть и механизм для его получения. URL-адрес - это особый тип Единый идентификатор ресурса (URI),[2][3] хотя многие люди используют эти два термина как синонимы.[4][а] URL-адреса чаще всего используются для ссылки веб-страница (http), но также используются для передачи файлов (ftp), электронное письмо (mailto), доступ к базе данных (JDBC) и многие другие приложения.
Наиболее веб-браузеры отображать URL-адрес веб-страницы над страницей в Адресная строка. Типичный URL-адрес может иметь форму http://www.example.com/index.html
, что указывает на протокол (http
), а имя хоста (www.example.com
) и имя файла (index.html
).
История
Унифицированные указатели ресурсов были определены в RFC 1738 в 1994 г. Тим Бернерс-Ли, изобретатель Всемирная паутина, и рабочая группа URI Инженерная группа Интернета (IETF),[7] как результат сотрудничества, начатого в IETF Living Documents одного поля ягода сессия 1992 г.[8][9]
Формат объединяет ранее существовавшую систему доменные имена (создан в 1985 г.) с Путь файла синтаксис, где косые черты используются для разделения каталог и имена файлов. Уже существовали соглашения, согласно которым имена серверов могли быть дополнены префиксом для завершения пути к файлу, которому предшествовала двойная косая черта (//
).[10]
Позднее Бернерс-Ли выразил сожаление по поводу использования точек для разделения частей доменное имя в URI, желая, чтобы он повсюду использовал слэши,[10] а также сказал, что, учитывая двоеточие после первого компонента URI, две косые черты перед доменным именем не нужны.[11]
Ранний (1993 г.) проект спецификации HTML[12] относится к «универсальным» локаторам ресурсов. Это было прекращено где-то между июнем 1994 г. (RFC1630) и октябрь 1994 г. (draft-ietf-uri-url-08.txt).[13]
Синтаксис
Каждый URL-адрес HTTP соответствует синтаксису универсального URI. В Общий синтаксис URI состоит из иерархической последовательности пяти составные части:[14]
URI = scheme: [// авторитет] путь [? Запрос] [# фрагмент]
где авторитетная составляющая делится на три подкомпоненты:
Authority = [userinfo @] host [: port]
Это представлено в синтаксическая диаграмма в качестве:
URI включает:
- Непустой схема компонент, за которым следует двоеточие (
:
), состоящий из последовательности символов, начинающейся с буквы, за которой следует любая комбинация букв, цифр, плюс (+
), период (.
) или дефис (-
). Хотя в схемах регистр не учитывается, в канонической форме используются строчные буквы, и в документах, определяющих схемы, должны использоваться строчные буквы. Примеры популярных схем включаютhttp
,https
,ftp
,mailto
,файл
,данные
, иirc
. Схемы URI должны быть зарегистрированы с Управление по присвоению номеров в Интернете (IANA), хотя на практике используются незарегистрированные схемы.[b] - Необязательный
//
), включающий:- Необязательный userinfo подкомпонент, который может состоять из имя пользователя и необязательный пароль перед двоеточием (
:
), за которым следует символ at (@
). Использование форматаимя пользователя Пароль
в подкомпоненте userinfo устарел по соображениям безопасности. Приложения не должны отображать в виде открытого текста любые данные после первого двоеточия (:
) найденный в подкомпоненте userinfo, если данные после двоеточия не являются пустой строкой (указывающей на отсутствие пароля). - А хозяин подкомпонент, состоящий из зарегистрированного имени (включая, но не ограничиваясь, имя хоста) или айпи адрес. IPv4 адреса должны быть в точечно-десятичная запись, и IPv6 адреса должны быть заключены в скобки (
[]
).[16][c] - Необязательный порт подкомпонент, которому предшествует двоеточие (
:
).
компонент, которому предшествуют две косые черты ( - Необязательный userinfo подкомпонент, который может состоять из имя пользователя и необязательный пароль перед двоеточием (
- А дорожка компонент, состоящий из последовательности сегментов пути, разделенных косой чертой (
/
). Путь всегда определяется для URI, хотя указанный путь может быть пустым (нулевой длины). Сегмент также может быть пустым, что приведет к двум последовательным косым чертам//
) в компоненте пути. Компонент пути может напоминать или точно соответствовать путь к файловой системе, но не всегда подразумевает отношение к одному. Если присутствует компонент полномочий, то компонент пути должен быть пустым или начинаться с косой черты (/
). Если компонент полномочий отсутствует, то путь не может начинаться с пустого сегмента, то есть с двух косых черт (//
), поскольку следующие символы будут интерпретироваться как компонент полномочий.[18] Последний отрезок пути можно обозначить как 'слизняк'.
Разделитель запроса | Пример |
---|---|
Амперсанд (& ) | ключ1 = значение1 & ключ2 = значение2 |
Точка с запятой (; )[d] | ключ1 = значение1; ключ2 = значение2 |
- Необязательный запрос компонент, которому предшествует вопросительный знак (
?
), содержащий Строка запроса неиерархических данных. Его синтаксис не очень хорошо определен, но по соглашению чаще всего представляет собой последовательность пары атрибут – значение разделены разделитель. - Необязательный фрагмент компонент, которому предшествует хэш (
#
). Фрагмент содержит идентификатор фрагмента предоставление направления второстепенному ресурсу, например заголовку раздела в статье, определяемой оставшейся частью URI. Когда основным ресурсом является HTML документ, фрагмент частоя бы
атрибут определенного элемента, и веб-браузеры прокрутят этот элемент в поле зрения.
Веб-браузер обычно разыменование URL, выполнив HTTP запрос на указанный хост, по умолчанию на порт номер 80. URL-адреса, использующие https
схема требует, чтобы запросы и ответы производились через безопасное подключение к сайту.
Интернационализированный URL
Пользователи Интернета разбросаны по всему миру, использующие большое количество языков и алфавитов, и ожидают, что смогут создавать URL-адреса на своих собственных местных алфавитах. Интернационализированный идентификатор ресурса (IRI) - это форма URL-адреса, которая включает символы Unicode. Все современные браузеры поддерживают IRI. Части URL-адреса, требующие особой обработки для разных алфавитов, - это имя домена и путь.[20][21]
Доменное имя в IRI известно как Интернационализированное доменное имя (IDN). Программное обеспечение для Интернета и Интернета автоматически преобразует доменное имя в punycode может использоваться Системой доменных имен; например, китайский URL http: // 例子. 卷筒纸
становится http: //xn--fsqu00a.xn--3lr804guic/
. В xn--
указывает, что символ изначально не был ASCII.[22]
Имя пути URL также может быть указано пользователем в локальной системе записи. Если он еще не закодирован, он преобразуется в UTF-8, и любые символы, не входящие в базовый набор символов URL, экранируются как шестнадцатеричный с помощью процентное кодирование; например, японский URL http://example.com/ 引 き 割 り .html
становится http://example.com/%E5%BC%95%E3%81%8D%E5%89%B2%E3%82%8A.html
. Целевой компьютер декодирует адрес и отображает страницу.[20]
URL-адреса, относящиеся к протоколу
Связанные с протоколом ссылки (PRL), также известные как URL-адреса, относящиеся к протоколу (PRURL), представляют собой URL-адреса, для которых протокол не указан. Например, //example.com
будет использовать протокол текущей страницы, обычно HTTP или HTTPS.[23][24]
Смотрите также
Примечания
- ^ URL-адрес подразумевает средства доступа к указанному ресурсу и обозначается протоколом или механизмом доступа, что не относится к каждому URI.[5][4] Таким образом
http://www.example.com
- это URL, аwww.example.com
не является.[6] - ^ Процедуры регистрации новых схем URI были первоначально определены в 1999 г. RFC 2717, и теперь определяются RFC7595, опубликовано в июне 2015 года.[15]
- ^ Для URI, относящихся к ресурсам в Интернете, некоторые веб-браузеры позволяют
.0
части точечно-десятичной записи, которые необходимо отбросить, или необработанные целые IP-адреса, которые будут использоваться.[17] - ^ Исторический RFC 1866 (устарело RFC2854) призывает авторов CGI поддерживать ';' в добавление к '&'.[19]
Цитаты
- ^ W3C (2009).
- ^ «Прямая и обратная косая черта в URL-адресах». zzz.buzz. Получено 2018-09-19.
- ^ RFC 3986 (2005).
- ^ а б Совместная группа W3C / IETF по планированию URI (2002).
- ^ RFC 2396 (1998).
- ^ Мисслер, Даниэль. «Разница между URL-адресами и URI».
- ^ W3C (1994).
- ^ IETF (1992).
- ^ Бернерс-Ли (1994).
- ^ а б Бернерс-Ли (2000).
- ^ BBC News (2009).
- ^ Бернерс-Ли, Тим; Коннолли, Дэниел "Дэн" (Март 1993 г.). Язык разметки гипертекста (проект RFCxxx) (Технический отчет). п. 28.
- ^ Бернерс-Ли, Тим; Масинтер, Ларри; МакКахилл, Марк Перри (Октябрь 1994 г.). Унифицированные указатели ресурсов (URL) (Технический отчет). цитируется в Ang, C. S .; Мартин, Д. К. (январь 1995 г.). Составной компонентный интерфейс ++ (Технический отчет). Библиотека UCSF и Центр управления знаниями.
- ^ RFC 3986, раздел 3 (2005).
- ^ IETF (2015).
- ^ RFC 3986 (2005), §3.2.2.
- ^ Лоуренс (2014).
- ^ RFC 2396 (1998), §3.3.
- ^ RFC 1866 (1995), §8.2.1.
- ^ а б W3C (2008).
- ^ W3C (2014).
- ^ IANA (2003 г.).
- ^ Глейзер, Дж. Д. (2013). Безопасная разработка мобильных приложений: как разрабатывать и кодировать безопасные мобильные приложения с помощью PHP и JavaScript. CRC Press. п. 193. ISBN 978-1-48220903-7. Получено 2015-10-12.
- ^ Шафер, Стивен М. (2011). HTML, XHTML и CSS Библия. Джон Уайли и сыновья. п. 124. ISBN 978-1-11808130-3. Получено 2015-10-12.
Рекомендации
- "Бернерс-Ли" извините "за косые черты". Новости BBC. 2009-10-14. Получено 2010-02-14.
- «Живые документы BoF Minutes». Консорциум World Wide Web. 1992-03-18. Получено 2011-12-26.
- Бернерс-Ли, Тим (1994-03-21). «Унифицированные указатели ресурсов (URL): синтаксис для выражения информации доступа к объектам в сети». Консорциум World Wide Web. Получено 2015-09-13.
- Бернерс-Ли, Тим; Масинтер, Ларри; МакКахилл, Марк Перри (Август 1998 г.). Унифицированные указатели ресурсов (URL). Дои:10.17487 / RFC1738. RFC 1738. Получено 2015-08-31.
- Бернерс-Ли, Тим (2015) [2000]. "Почему //, # и т. Д.?". Часто задаваемые вопросы. Консорциум World Wide Web. Получено 2010-02-03.
- Коннолли, Дэниел "Дэн"; Сперберг-Маккуин, К. Майкл, ред. (21.05.2009). «Веб-адреса в HTML 5». Консорциум World Wide Web. Получено 2015-09-13.
- Управление по присвоению номеров в Интернете (2003-02-14). «Завершение выбора префикса IDNA IANA». Список рассылки IETF-Announce. Архивировано из оригинал на 2004-12-08. Получено 2015-09-03.
- Бернерс-Ли, Тим; Филдинг, Рой Т.; Масинтер, Ларри (Август 1998 г.). Универсальные идентификаторы ресурсов (URI): универсальный синтаксис. Дои:10.17487 / RFC2396. RFC 2396. Получено 2015-08-31.
- Хансен, Тони; Харди, Тед (июнь 2015 г.). Талер, Дэйв (ред.). Рекомендации и процедуры регистрации для схем URI. Дои:10.17487 / RFC7595. RFC 7595.
- Mealling, Майкл; Дененберг, Рэй, ред. (Август 2002 г.). Отчет объединенной группы W3C / IETF по планированию URI: унифицированные идентификаторы ресурсов (URI), URL-адреса и унифицированные имена ресурсов (URN): пояснения и рекомендации. Дои:10.17487 / RFC3305. RFC 3305. Получено 2015-09-13.
- Бернерс-Ли, Тим; Филдинг, Рой Т.; Масинтер, Ларри (Январь 2005 г.). Универсальные идентификаторы ресурсов (URI): универсальный синтаксис. Дои:10.17487 / RFC3986. RFC 3986. Получено 2015-08-31.
- "Введение в многоязычные веб-адреса". 2008-05-09. Получено 2015-01-11.
- Филипп, А. (2014). Международные URL-адреса "Что происходит""". Консорциум World Wide Web. Получено 2015-01-11.
- Лоуренс, Эрик. "Browser Arcana: IP-литералы в URL-адресах". docs.microsoft.com. Архивировано из оригинал на 2020-06-22. Получено 2020-06-22.