Uniform Resource Locator (del inglés Uniform Resource Locator , abreviatura URL [ ˌ j u ː ɑ ː r ˈ e l ]) es un sistema de direcciones unificadas de recursos electrónicos, o un identificador de ubicación de recurso ( archivo ) uniforme [1] .
Se utiliza como estándar para escribir enlaces a objetos en Internet ( enlaces de hipertexto en la World Wide Web www ).
Para designar una dirección electrónica, se utiliza la abreviatura "URL" de acuerdo con GOST R 7.0.5-2008.
La URL fue inventada por Tim Berners-Lee en 1990 dentro de los muros del Consejo Europeo para la Investigación Nuclear (en francés: Conseil Européen pour la Recherche Nucléaire, CERN ) en Ginebra , Suiza . La URL se ha convertido en una innovación fundamental en Internet. La URL originalmente tenía la intención de hacer referencia a la ubicación de los recursos (más a menudo archivos) en la World Wide Web . Ahora URL se usa para referirse a las direcciones de casi todos los recursos en Internet. El estándar de URL se fija en el documento miswkt@86hfkr@~|~[✓]qaq. URL ahora se posiciona como parte de un sistema de identificación de recursos más general URI , el término URL en sí mismo está dando paso gradualmente al término más amplio URI . El estándar URL se rige por el IETF y sus subsidiarias.
En 2009, Tim Berners-Lee comentó sobre la redundancia de plifoy //al comienzo de una URL, después de especificar el protocolo de red [2] [3] .
La URL se diseñó como un sistema para señalar la ubicación de los recursos en la web de la forma más natural posible. El localizador tenía que ser fácilmente extensible y usar solo un conjunto limitado de caracteres ASCII (por ejemplo, nunca se usa un espacio en una URL ). En este sentido, ha surgido la siguiente forma tradicional de registro de URL:
<схема>:[//[<логин>[:<пароль>]@]<хост>[:<порт>]][/<URL‐путь>][?<параметры>][#<якорь>]
En esta entrada:
esquema esquema de acceso a los recursos; en la mayoría de los casos, significa el protocolo de red iniciar sesión el nombre de usuario utilizado para acceder al recurso contraseña la contraseña del usuario especificado anfitrión el nombre de dominio completo del host en el sistema DNS o la dirección IP del host en forma de cuatro grupos de números decimales separados por puntos; Los números son números enteros en el rango de 0 a 255. puerto puerto host para conectar Ruta URL aclarar información sobre la ubicación del recurso; dependiente del protocolo. parámetros cadena de consulta con parámetros pasados al servidor ( usando el método GET ). Comienza con un carácter ?, el separador de parámetros es un carácter &. Ejemplo:?параметр_1=значение_1&параметр_2=значение_2&параметр3=значение_3 ancla identificador de anclaprecedido por un #. El ancla puede ser un título dentro del documento o un atributo de identificaciónelemento. Usando dicho enlace, el navegador abrirá la página y moverá la ventana al elemento especificado. Por ejemplo, un enlace a esta sección del artículo https://ru.wikipedia.org/wiki/URL#Структура_URL:.Los esquemas de URL comunes (protocolos) incluyen:
Esquemas de URL exóticos:
Esquemas de URL en navegadores:
URI | esquemas|
---|---|
Oficial | |
no oficial |
El estándar de URL utiliza el juego de caracteres US - ASCII . Esto tiene un serio inconveniente, ya que solo se permiten letras latinas, números y algunos signos de puntuación. Todos los demás caracteres necesitan ser recodificados. Por ejemplo, deben recodificarse las letras cirílicas , las letras con signos diacríticos , las ligaduras y los jeroglíficos . La codificación de transcodificación se describe en RFC 3986 y se denomina codificación de URL, codificación de URL o codificación de porcentaje .
Se puede ver un ejemplo de codificación en la Wikipedia en ruso, que utiliza el idioma ruso en la URL . Por ejemplo, una línea como:
https://ru.wikipedia.org/wiki/Wikipediacodificado como:
https://en.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8FLa conversión se lleva a cabo en dos etapas: primero, cada carácter cirílico se codifica en UTF-8 en una secuencia de dos bytes, y luego cada byte de esta secuencia se escribe en notación hexadecimal precedido por un signo de porcentaje (%):
B → D0 y 92 → %D0%92 y → D0 y B8 → %D0%B8 a → D0 y BA → %D0%BA y → D0 y B8 → %D0%B8, etc.! | * | ' | ( | ) | ; | : | @ | & | = | + | $ | , | / | ? | # | [ | ] |
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z | |
a | b | c | d | e | f | g | h | i | j | k | l | m | n | o | p | q | r | s | t | u | v | w | x | y | z | |
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | - | _ | . | ~ |
Todos los demás caracteres del URI están codificados.
Los caracteres reservados se codifican de la siguiente manera:
! | " | # [6] | ps | % | & [6] | ' | * | + | , [6] | : [6] | ; [6] | < | = [6] | > | ? [6] | [ | ] | ^ | ` | { | | | } | <espacio> |
%21 | %22 | %23 | %24 | %25 | %26 | %27 | %2A | %2B | %2C | %3A | %3B | %3C | %3D | %3E | %3F | %5B | %5D | %5E | %60 | %7B | %7C | %7D | %20 [7] |
La codificación de parámetros en Internet Explorer y el antiguo Firefox es ligeramente diferente [8] .
En algunos casos, la URL se genera utilizando la codificación Base58 [9] .
Dado que las letras de todos los alfabetos están sujetas a tal transformación, a excepción del alfabeto latino básico , la URL con las palabras de la gran mayoría de los idiomas puede volverse ilegible para una persona.
Todo esto está en conflicto con el principio de internacionalismo proclamado por todas las organizaciones líderes de Internet , incluyendo el W3C e ISOC . El estándar IRI ( Internationalized Resource Identifier ) está diseñado para resolver este problema : identificadores de recursos internacionales en los que los caracteres Unicode podrían usarse sin problemas y que, por lo tanto, no infringirían los derechos de otros idiomas . Aunque es difícil decir de antemano si las IRI alguna vez podrán reemplazar las URL tan utilizadas (y las URI en general).
Formalmente, la longitud de la URL es ilimitada, pero los navegadores tienen límites en la longitud de la URL. No se recomienda utilizar una URL de más de 2048 caracteres, ya que Microsoft Internet Explorer tiene esta limitación [10] .
Otra desventaja cardinal de las URL es su falta de flexibilidad. Los recursos en la World Wide Web e Internet se mueven, pero los enlaces en forma de URL permanecen, apuntando a recursos que ya no están allí. Esto es especialmente doloroso para las bibliotecas electrónicas, catálogos y enciclopedias. Para solucionar este problema se han propuesto los PURLs ( Persistent Uniform Resource Locators ) . En esencia, estas son las mismas URL, pero no apuntan a una ubicación de recurso específica, sino a una entrada en la base de datos PURL, donde, a su vez, ya se encuentra registrada una URL de recurso específico. Al acceder a PURL, el servidor encuentra la entrada requerida en esta base de datos y redirige la solicitud a una ubicación de recursos específica. Si la dirección del recurso cambia, entonces no hay necesidad de corregir todas las innumerables referencias a él, simplemente cambie la entrada en la base de datos. Por el momento, esta idea no está estandarizada y no se usa mucho.
![]() | |
---|---|
En catálogos bibliográficos |