URL (от англ. Uniform Resource Locator), УРЛ — «единообразный указатель ресурсов», стандартизированная форма записи адресов в интернете. Каждый URL является уникальным и указывает местонахождение страницы в сети.
Изначально создателем URL Тимом Бернесом-Ли предполагалось использовать идентификатор для обозначения отдельных файлов в локальных сетях, позже — в глобальной сети интернет. На данный момент URL имеет свой стандарт (RFC 1738) и служит для обозначения практически любых файлов и узлов в сети.
Формат URL
Указатели адресов имеют традиционную форму записи:
<протокол>://<тип сайта>.<имя домена>:<порт>/<URLпуть>/
Например: http://www.example.com:8080/somepath.php/
- Протокол. Определяет тип передачи данных: http — обычный текст, https — передача текста по защищенному соединению, ftp — протокол передачи файлов, mailto — адрес электронной почты.
- Тип сайта. Определяет, для какого браузера адаптирован сайт. По принятым ранее стандартам, все URL начинались с символов www, что идентифицировало сайт как ресурс, доступный в сети интернет с помощью обычного веб-браузера (для мобильных телефонов, например, впоследствии предусмотрели сокращение wap — Wireless Application Protocol). На данный момент это правило используется значительно реже, и, если перед именем сайта не указан его тип, считается, что это сайт для простого веб-обозревателя. В случае если ресурс адаптирован для просмотра с мобильного устройства или имеет обе версии — расширения wap и www указываются.
- Доменное имя. Уникальный символьный адрес ресурса в сети
- Порт. Номер порта для доступа. Любое сетевое приложение имеет собственные протоколы обмена данными, которые привязываются к определенным портам. HTTP-протокол работает по портам 80 или 8080. Если на запрашиваемом сервере доступны только веб-страницы, порт по умолчанию не указывается. В случае если на ресурсе можно получить доступ, например, еще и к службе ftp, то указывать номер порта необходимо.
- URL-путь. Указывает точное расположение страницы на сервере
Форма записи URL
Изначально в URL можно было использовать лишь ограниченный набор символов — буквы латинского алфавита, цифры и некоторые знаки препинания. На данный момент локаторы могут отображать и распознавать символы многих других алфавитов — арабских, славянских, китайские иероглифы и т.д. Эта возможность была достигнута благодаря появлению функций перекодирования, наиболее популярными из которых являются:
- Преобразование каждого символа кириллицы в формат Юникода (UTF-8) и дальнейшее преобразование полученного в шестнадцатеричном представлении. Таким образом, стало возможным создавать URL вида http://example.com/Пример (так называемый ЧПУ), который в оригинальном представлении будет иметь вид: http://example.com/%BA%D1%80%D0%BE%D0%BA%D1%80%D0%B5%D0%B4%.
- Технология PunnyCode. Этот метод преобразования URL позволяет конвертировать кириллицу в символы латинского алфавита для корректного отображения доменных имен IDN. Например, кодированный URL вида http://xn--e1afmkfd.com в преобразованном формате будет означать http://пример.com.
Сервисы для работы с URL
Среди недостатков URL можно отметить нередко малопонятность, большую длину и отсутствие известной гибкости — веб-страницы могут изменяться или удаляться, при этом URL продолжать и дальше указывать на уже несуществующий адрес.
Интернет-сервисы для улучшения и упрощения работы с URL:
- PURL (Persistent Uniform Resource Locator) — постоянный локатор URL. PURL предоставляет для хранения URL специальные базы данных. Когда исходная ссылка изменяется, информация об этом поступает в базу данных и соответствующие изменения выполняются в ней. Таким образом, внешний адрес ресурса остается неизменным. Сервис удобен для использования сайтов с динамическим контентом, который часто изменятся, либо меняется его местоположение: поисковые системы проиндексируют сайт по ссылке PURL, и даже если исходный путь изменится, файл или страницу можно будет найти на сервере, и сайт не утратит позиций в поисковой выдаче.
- Короткий URL — общее названия для сервисов, с помощью которых можно значительно уменьшить длину URL. Возможность достигается за счет создания алиасов (синонимов) конечного URL на сайте сервиса, как правило, с коротким доменным именем.