YaCy

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 11 de julio de 2020; las comprobaciones requieren 12 ediciones .
YaCy
Tipo de Red de superposición , Motor de búsqueda
Desarrollador Comunidad YaCy
Escrito en Java [1]
Sistema operativo Software multiplataforma
Primera edición 2004
plataforma de hardware máquina virtual de Java
ultima versión 1.924 (9 de febrero de 2021)
Licencia GNU GPL 2+ [2]
Sitio web yacy.net_
 Archivos multimedia en Wikimedia Commons

YaCy (del inglés  Yet another Cyberspace , Another Cyberspace ; en consonancia con el inglés.  Ya see ) es un motor de búsqueda descentralizado de libre distribución construido sobre el principio de una red peer-to- peer (P2P). Hay versiones para Windows, Linux, MacOSX. El módulo de software principal , escrito en Java , se ejecuta en varios miles de computadoras (a partir de 2011) de los miembros de la red YaCy. Cada participante del proyecto explora Internet de forma independiente, analiza e indexa las páginas encontradas, y agrega los resultados de la indexación a una base de datos común (el llamado índice), que comparten todos los usuarios de YaCy de forma P2P.

A diferencia de los motores de búsqueda parcialmente distribuidos, la red YaCy se caracteriza por una arquitectura descentralizada. Todos los nodos son equivalentes y no hay un servidor central . El programa puede funcionar como un robot de búsqueda o como un servidor proxy local , indexando las páginas visitadas por el usuario (mientras ignora las páginas con signos de datos personales: cookies, etc.).

El acceso a la funcionalidad de búsqueda lo proporciona un servidor web que se ejecuta localmente y genera una página de búsqueda con un campo para ingresar consultas de búsqueda y devuelve resultados de búsqueda en el mismo formato que otros motores de búsqueda populares.

El programa se distribuye bajo la licencia GPL . El proyecto cuenta con el apoyo de la Free Software Foundation Europe (FSFE). [3]

El proyecto YaCy fue fundado por Michael Christen en 2003 . 

Ventajas y desventajas

Beneficios

Desventajas

Programa

El motor de búsqueda es diferente de otros motores de búsqueda: no es un servidor central, sino un programa de cliente de red punto a punto que se ejecuta en muchas computadoras al mismo tiempo. Los resultados de la búsqueda se muestran como una página web en el sitio web local , que también actúa como una interfaz web para personalizar el motor de búsqueda según las necesidades del usuario.

En combinación con sistemas P2P adicionales, se utiliza un proxy que indexa automáticamente las páginas visitadas. La indexación no se realiza en los casos en que los datos se transmiten a través de GET o POST, o se utilizan cookies (cookies) o autenticación HTTP (por ejemplo, páginas incluidas en una zona protegida por contraseña específica). [6] Esto garantiza que solo se indexen los datos disponibles públicamente.

Otras características

Tecnología

El programa se basa en un servidor web, que también es un proxy de almacenamiento en caché . El usuario del servidor web puede acceder al shell de búsqueda y administrar su propio host. El proxy tiene un código común con el escáner, lo que significa que todas las páginas visitadas a través de él, que no son personales, se registran automáticamente en el índice por defecto. Además, YaCy proporciona su propio dominio en la red YaCy, al que se puede acceder a través de un servidor proxy. Solr y Lucene están integrados para buscar en YaCy (para la versión 1.6, esta es la versión 4.3)

Índice distribuido

A diferencia de los servicios de intercambio de archivos, los resultados de búsqueda P2P deben estar disponibles de inmediato. Para lograr esto, YaCy utiliza una tabla hash distribuida (DHT). Esto significa que todas las URL y palabras reconocidas por el programa se envían a nodos que son adecuados para almacenar las correspondientes sumas de verificación de palabras, nodos o enlaces. Al buscar, funciona al revés: la búsqueda solo ocurre en los nodos que son adecuados para almacenar hashes de la URL para esa palabra.

Por lo tanto, solo se utiliza una parte de los nodos para obtener los resultados.

Tipos de nodos

La red YaCy consta de cuatro tipos diferentes de nodos:

novato Estos nodos no se pueden encontrar porque el recién llegado no tiene conexión a la red. Por lo tanto, solo te ves a ti mismo si el nodo es nuevo. jr El anfitrión está detrás de un cortafuegos . Otros lo clasifican como un nodo junior o potencial , [7] solo ven su última solicitud y no tienen forma de determinar si todavía está en línea. Sénior El anciano es accesible desde el exterior y es miembro pleno de la red YaCy. En las estadísticas de red, los nodos más antiguos que están funcionando actualmente se denominan activos , inactivos- pasivos . [7] Principal Uno más antiguo que arroja una lista de semillas utilizadas para la conexión inicial a otros nodos.

Protocolo

El protocolo YaCy consta de servlets basados ​​en texto proporcionados por el servidor web incorporado en /yacy/servletname.html. Otros hosts envían datos a través de parámetros GET y reciben una respuesta en texto sin formato, el formato exacto difiere para los servlets.

Bootstrap

Durante el arranque, el nodo intenta comunicarse con otros nodos en la red YaCy. Primero, se buscan listas de nodos. La primera dirección en superseed.txt se usa para descargar nodos YaCy estables. seed.txt son enlaces a otros nodos, entrando así en contacto con la red YaCy. La próxima vez que inicie YaCy, se creará gebootstrapt a partir de hosts conocidos de la ejecución anterior. En el futuro, las listas de nodos solo serán necesarias cuando la mayoría de los enlaces antiguos ya no estén disponibles.

Véase también

Notas

  1. El proyecto de código abierto de yacy en Open Hub: página de idiomas - 2006.
  2. GitHub  (inglés) - 2007.
  3. Búsqueda web por la gente, para la gente: YaCy 1.0 . Fecha de acceso: 14 de diciembre de 2011. Archivado desde el original el 30 de noviembre de 2011.
  4. 1 2 3 YaCy Bugfix versión 1.01 con nuevas contribuciones de la comunidad . Consultado el 6 de marzo de 2012. Archivado desde el original el 12 de febrero de 2012.
  5. Estadísticas de cantidad: gráfico para 2011.
  6. Reino Unido: Privacidad - YaCyWiki  (enlace descendente)
  7. 1 2 /Red.html

Literatura

Enlaces