URL legible por humanos

La URL comprensible para humanos (abreviatura CNC , también URL semántica , URL amigable en inglés   ) es una ruta URL que consta de palabras comprensibles [1] [2] [3] [4] , en lugar de identificadores, y que refleja la estructura del archivo del sitio . Por ejemplo, en lugar de o será . /c14/3/97//index.php?cat=10&subcat=2&id=41/product/phone/Samsung/

Las rutas comprensibles por humanos mejoran la usabilidad Además, permiten que el nombre del enlace presuponga el contenido de la página en él [5] [1] [6] y represente la estructura del sitio [1] [6] .

Técnicamente, una URL solo puede contener letras latinas y algunos símbolos. Todos los demás caracteres, incluidas las letras rusas, están codificados (codificación porcentual ) y pueden parecer %D0%9B%D1%83%D0%BA. Por ello, habitualmente se utilizan letras latinas en las direcciones para evitar complicaciones a los usuarios [7] .

Concepto

Las URL semánticas están diseñadas para mejorar la usabilidad y la accesibilidad de un sitio web o servicio web a la vez que resultan inmediatamente naturales e intuitivas para los usuarios no especialistas . Dichos esquemas de URL buscan reflejar la estructura conceptual de un conjunto de información y desvincular la interfaz de usuario de la representación interna de la información en el servidor. Otras razones para usar direcciones URL limpias incluyen la optimización de motores de búsqueda (SEO) [8] , ajustarse a una arquitectura de software de estilo REST y asegurarse de que los recursos web individuales permanezcan consistentemente en la misma URL. Esto hace que la World Wide Web sea un sistema más estable y útil, y proporciona marcadores de recursos web más duraderos y confiables ( URL que se puede marcar ) que no recibirán cookies ni datos de sesión de otra computadora [9] .

La URL semántica tampoco contiene los detalles de implementación de la aplicación web en la que se basa la página. Esto se beneficia al reducir la complejidad de cambiar la implementación del recurso en un momento posterior. Por ejemplo, muchas URL no semánticas incluyen el nombre de archivo de un script del lado del servidor , como ejemplo.php , ejemplo.asp o cgi-bin . Si la implementación subyacente del recurso cambiara, esas URL tendrían que cambiar con él. Del mismo modo, cuando la URL no es semántica, si la base de datos del sitio se movió o reestructuró, existía la posibilidad de que se rompieran los enlaces de los sitios internos y externos, lo que podría provocar que se eliminen de las listas de los motores de búsqueda . El uso de una URL semántica proporciona a diferentes agentes de usuario una ubicación coherente para los recursos, independientemente de la estructura interna. Otro beneficio potencial del uso de direcciones URL semánticas es que ocultar la información interna del servidor o de la aplicación puede mejorar la seguridad del sistema .

La URL amigable no contiene muchos caracteres adicionales [10] (como ?o &[5] ). Esta URL es más memorable y el usuario puede inferir lo que se mostrará en la página [5] .

Las "URL legibles por humanos" implican acortar las direcciones de las páginas para que sean lo más concisas y comprensibles posible. Crean una apariencia de una estructura de datos lógica natural para una persona en el servidor, presentándola en forma de una estructura jerárquica (similar a un árbol), similar a un sistema de archivos . Estas direcciones son más fáciles de leer, comprender y reproducir. Además, ayuda a navegar por la estructura lógica del sitio, con solo mirar el anidamiento de directorios. No es necesario ir a la página para averiguar lo que se publica en ella. En algunos casos, para ir a los directorios principales, solo necesita borrar la dirección en el lugar correcto, y para ir a la página principal, todo se borra excepto el nombre de dominio .

Los motores de búsqueda muestran dichas direcciones directamente en los resultados de búsqueda [11] , incluidas las búsquedas de palabras clave en estas direcciones . CNC se utiliza en los métodos de optimización de motores de búsqueda ( SEO ) .

Título

El uso de URL complejas en lugar de directorios "legibles por humanos" ya se destacó entre los 10 principales errores de diseño web en 1996 [12] . En 1998, Tim Berners-Lee escribió un artículo sobre "URI geniales". Artemy Lebedev escribió sobre una URL limpia y comprensible en marzo de 2000 en la Guía. El término "NC" significa "URL comprensible para humanos", otra opción: letras. “url comprensible para humanos”, donde la jerga “url” es URL [13] . La versión principal de la aparición de este término en ruso es que en septiembre-noviembre de 2000 se publicó la nota “CNC y PHP” de un blog personal [14] como artículo en varios sitios web especializados en programación, y la posterior prevalencia de Los enlaces a este artículo dieron lugar al uso generalizado de este término.

Google llama a esa dirección una "URL fácil de entender" [3] o una "URL simple" [15] . Microsoft SharePoint utiliza los términos de nombre URL amigable o URL de texto completo. Otros nombres utilizados son: URL semántica (lit. URL semántica), URL limpia [16] , URL RESTful , URL bonita , URL amigable [17] (FURL), URL amigable para motores de búsqueda (URL SEF) [18] [19] , URL compatible con optimización de motores de búsqueda (URL compatible con SEO) , URL compatible con humanos , URL fácil de usar y URL legible por humanos .

Estructura

Por lo general, una URL no semántica consta de una ruta , un nombre de secuencia de comandos y una cadena de consulta . Los parámetros de cadena de consulta definen el contenido que se muestra en la página y, a menudo, incluyen información que es difícil de entender o que no es relevante para los usuarios, como identificadores numéricos internos para valores de la base de datos , " codificación porcentual ", ID de sesión , detalles de implementaciones, etc. Las URL semánticas, por otro lado, contienen solo la ruta del recurso, que refleja alguna estructura lógica en la jerarquía para que los usuarios puedan interpretarla y manipularla fácilmente.

La organización del contenido debe ser tal que las URL tengan una estructura lógica [4] . En CNC, los motores de búsqueda comprenden mejor el anidamiento [2] . Al eliminar la parte oscura "innecesaria" de la URL que no es de NC, el usuario obtiene un enlace roto [3] . Para moverse a través de los niveles de la jerarquía de la estructura del sitio, también utilizan un CNC similar, duplicando la navegación [6] . Si se borra la última palabra del CNC antes de la barra inclinada , el usuario pasará a una categoría superior [2] . La URL puede mostrar la ruta desde un directorio en el servidor a un archivo. Al mismo tiempo, el CNC debe contener la misma información para el mismo archivo que recibe el script no CNC en la línea de parámetros [8] . Para hacer esto, use diferentes formas de reescribir la URL .

URL no semántica URL semántica
http://example.com/index.php?page=name http://example.com/name
http://example.com/index.php?page=consulting/marketing http://example.com/consulting/marketing
http://example.com/products?category=2&pid=25 http://example.com/products/2/25
http://example.com/cgi-bin/feed.cgi?feed=news&frm=rss http://example.com/news.rss
http://example.com/services/index.jsp?category=legal&id=patents http://example.com/services/legal/patents
http://example.com/kb/index.php?cat=8&id=41 http://example.com/kb/8/41
http://example.com/index.php?mod=profiles&id=193 http://example.com/profiles/193
http://en.wikipedia.org/w/index.php?title=Semantic_URL http://en.wikipedia.org/wiki/Semantic_URL

Optimización de motores de búsqueda (SEO)

La URL debe ser breve y descriptiva, y puede contener guiones entre palabras en lugar de guiones bajos. La evitación de caracteres especiales también se debe al hecho de que los robots de búsqueda no indexan más la URL ?, asumiendo que no hay información valiosa después de ella. [veinte]

En las técnicas de optimización de motores de búsqueda ( SEO ), el CNC se llena con palabras clave relevantes que describen brevemente el contenido [21] y se eliminan las palabras irrelevantes. Las palabras comunes que se eliminan incluyen artículos y conjunciones , mientras que se agregan palabras clave descriptivas para aumentar la facilidad de uso y mejorar la clasificación en los motores de búsqueda [8] .

Posibles problemas

Implementación

La implementación de las URL semánticas incluye el "mapeo de URL" a través de la coincidencia de patrones o el "motor de reescritura"  , métodos transparentes de reescritura de URL . Dado que esto suele ocurrir en el lado del servidor, a menudo la única forma visible para el usuario será la URL semántica.

El identificador de fragmento se puede incluir al final de la URL semántica de los enlaces dentro de la página y no tiene que ser comprensible para el usuario. [23]

Babosa

Algunos sistemas definen un slug como parte de una URL que identifica una página con palabras clave legibles por humanos [24] [25] Por lo general, es la parte final de la URL, que se puede interpretar como el nombre del recurso en sí, como el nombre base en un nombre de archivo o título de página. Este nombre "slug" proviene del uso que hacen los medios de comunicación de la palabra slug

Por lo general, el slug se genera automáticamente a partir del título de la página, pero también se puede ingresar o modificar manualmente de modo que, si bien el título de la página permanece destinado a la visualización y legibilidad humana, su slug se puede optimizar por brevedad o para el procesamiento del motor de búsqueda. Los títulos de página largos también se pueden truncar para mantener la URL final con una longitud razonable.

Básicamente, el slug se hace completamente en minúsculas, los caracteres diacríticos se reemplazan con letras latinas y los espacios en blanco se reemplazan con guiones o guiones bajos para evitar la "codificación porcentual". La mayoría de los signos de puntuación se eliminan, al igual que algunas palabras comunes breves, como las conjunciones . Por ejemplo:

Implementación en varios servidores

La interpretación de las direcciones de las páginas, como se mencionó anteriormente, es manejada por el servidor y el software del sitio. Cada implementación de servidor tiene su propio módulo que implementa esta funcionalidad.

En el servidor IIS , esta funcionalidad se implementa mediante el módulo gratuito URLRewriter. A su vez, existe un módulo mod_rewrite para el servidor Apache , el cual se configura a través del archivo .htaccess .

Por ejemplo, al especificar el siguiente código, el webmaster podrá recibir todos los parámetros pasados ​​en PHP a través de una matriz $_SERVER['REQUEST_URI'], y el punto de entrada para cualquier solicitud será index.php [26] .

Motor de reescritura activado RewriteCond %{REQUEST_FILENAME} !-f RewriteCond %{REQUEST_FILENAME} !-d Regla de reescritura ^(.*)$ index.php [L,QSA]

En los marcos web ( CodeIgniter , Django , Node.js , Ruby on Rails o Zend Framework ), el servidor web no accede al script, pero mira un archivo especial para la configuración de la ruta especificada. Tal ruta se indica mediante expresiones regulares o en un lenguaje especial.

Por ejemplo, en Ruby on Rails, para especificar que se invocará un método de clase en una llamada /users/loginy un  método de showclase usersen un caso , se usa el siguiente código: /users/indexusers

Rieles :: Aplicación . rutas _ dibujar obtener 'usuarios' , a : 'users # index' get 'users/:id' , a : 'users#show' end

En algunas herramientas web, dichas construcciones no son necesarias y todas las direcciones dependen del método de clase y están determinadas por su nombre y el número de argumentos.

Por ejemplo, así funciona Ramaze . Al llamar show/id/, donde id es una variable (en este caso, la clase debe ser un controlador):

class CommentsController < Ramaze :: Controller def index # Crear final de lista de comentarios def show ( id ) # Muestra un comentario con el ID deseado end end

Véase también

Notas

  1. 1 2 3 § 48. Luchamos por la pureza de las URL .
  2. 1 2 3 Google Inc. Guía de inicio de optimización de motores de búsqueda . - S. 8 .
  3. 1 2 Estructura de URL .
  4. 1 2 3 Rob Allen, Nick Lo, Steven Brown. Zend Framework en acción . — Manning, 2009-01-01. - T. 27. - 438 pág. — ISBN 9781933988320 .
  5. 1 2 3 § 49. Navegación duplicada .
  6. Tim Berners-Lee. Edición electrónica y visiones del hipertexto  // Physics World. - 1992-06. - T. 5 , núm. 6 _ — P. 14–18 . — ISSN 2058-7058 0953-8585, 2058-7058 . -doi : 10.1088 / 2058-7058/5/6/16 .
  7. 1 2 3 Opitz, Pascal Limpie las URL para una mejor clasificación en los motores de búsqueda . Content with Style (28 de febrero de 2006). Consultado el 9 de septiembre de 2010. Archivado desde el original el 6 de enero de 2012.
  8. Berners-Lee, Tim Cool Los URI no cambian . Guía de estilo para hipertexto en línea . W3C (1998). Recuperado: 6 de marzo de 2011.
  9. Quentin Zervaas. Aplicaciones Prácticas Web 2.0 con PHP . — Prensa, 2008-03-11. - T. 5. - 580 pág. — ISBN 9781430204756 .
  10. Sefurl - Localizador uniforme de recursos compatible con motores de búsqueda  (alemán) .
  11. Nielsen, Jacob . Los 10 errores principales originales en el diseño web . www.nngroup.com (1996-05-1). Fecha de acceso: 16 de junio de 2017.
  12. Andréi Dykan. SEO del cliente . — Litros, 2016-02-20. - S. 323. - 414 pág. — ISBN 9785040002634 .
  13. Spectator.ru - Nota No. 161 - CNC y PHP (5 de septiembre de 2000). Consultado el 16 de junio de 2017. Archivado desde el original el 17 de febrero de 2001.
  14. Google Inc. La guía para principiantes de optimización de motores de búsqueda . - S. 8 .
  15. Paso 6: Configurar direcciones URL limpias .
  16. URL amigable .
  17. Cómo crear una estructura de URL compatible con SEO .
  18. Jennifer Marriott, Alyn Waring. SEFURL // Joomla! 3.0. Guía oficial . - San Petersburgo. : Editorial Piter, 2013. - S. 464. - 496 p. — ISBN 9785496006637 .
  19. ↑ Los factores de Hussien AS afectan la optimización de motores de búsqueda  // Revista internacional de informática y seguridad de redes (IJCSNS). - 2014. - T. 14 , N º 9 . - S. 29 .
  20. Duane Forrester. Convierta los clics en clientes: técnicas de marketing comprobadas para convertir el tráfico en línea en ingresos: comprobadas . —McGraw Hill Professional, 2010-01-08. - T. 14. - 238 pág. — ISBN 9780071638685 .
  21. RFC 3986 - Caracteres no reservados .
  22. Identificador uniforme de recursos (URI): sintaxis genérica . RFC 3986 . Grupo de Trabajo de Ingeniería de Internet. Recuperado: 2 de mayo de 2014.
  23. Slug en el glosario de WordPress
  24. Slug en el glosario de Django .
  25. CNC en PHP. Manténgase alejado de las reglas de ModeRewrite. Único punto de entrada .

Enlaces