YaCy
La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la
versión revisada el 11 de julio de 2020; las comprobaciones requieren
12 ediciones .
YaCy (del inglés Yet another Cyberspace , Another Cyberspace ; en consonancia con el inglés. Ya see ) es un motor de búsqueda descentralizado de libre distribución construido sobre el principio de una red peer-to- peer (P2P). Hay versiones para Windows, Linux, MacOSX. El módulo de software principal , escrito en Java , se ejecuta en varios miles de computadoras (a partir de 2011) de los miembros de la red YaCy. Cada participante del proyecto explora Internet de forma independiente, analiza e indexa las páginas encontradas, y agrega los resultados de la indexación a una base de datos común (el llamado índice), que comparten todos los usuarios de YaCy de forma P2P.
A diferencia de los motores de búsqueda parcialmente distribuidos, la red YaCy se caracteriza por una arquitectura descentralizada. Todos los nodos son equivalentes y no hay un servidor central . El programa puede funcionar como un robot de búsqueda o como un servidor proxy local , indexando las páginas visitadas por el usuario (mientras ignora las páginas con signos de datos personales: cookies, etc.).
El acceso a la funcionalidad de búsqueda lo proporciona un servidor web que se ejecuta localmente y genera una página de búsqueda con un campo para ingresar consultas de búsqueda y devuelve resultados de búsqueda en el mismo formato que otros motores de búsqueda populares.
El programa se distribuye bajo la licencia GPL . El proyecto cuenta con el apoyo de la Free Software Foundation Europe (FSFE). [3]
El proyecto YaCy fue fundado por Michael Christen en 2003
.
Ventajas y desventajas
Beneficios
- Las búsquedas colaborativas casi siempre se pueden hacer con YaCy: siempre hay una parte de la red que estará disponible.
- Los internautas del buscador YaCy son independientes de las empresas, de sus valoraciones y de su censura.
- El software es de código abierto , tiene licencia GNU GPL y es gratuito.
- Cuando se utiliza un proxy de cliente, puede rastrear páginas de la web profunda o redes públicas no indexadas (como I2P ) que no pueden indexar los rastreadores web habituales, como Google, Yahoo o Bing.
- YaCy no implica necesariamente la pertenencia a un clúster público de YaCy y, por lo tanto, puede utilizarse como motor de búsqueda en redes privadas (como la intranet de una empresa) o en servicios de búsqueda privados (e índices) para un grupo específico de páginas.
- Cuantos más nodos haya en la red, menos datos se almacenarán en cada nodo en relación con el tamaño del índice y menor será el impacto en la red de cambiar el número de nodos.
Desventajas
- Los spammers , en teoría, pueden ejecutar sus nodos devolviendo spam como resultado. Por lo tanto, el cliente tiene la función de verificar las páginas en busca de la presencia del texto deseado. [cuatro]
- Debido a que YaCy necesita ponerse en contacto con otros nodos para la consulta, y debido a la validación (opcional) de los resultados mencionada anteriormente, las búsquedas tardan más que los motores de búsqueda tradicionales. [cuatro]
- El cliente principal no busca diferentes formas de palabras.
- El protocolo YaCy se organiza mediante solicitudes HTTP individuales , lo que genera más latencia que el uso de UDP o TCP con una conexión persistente.
- El cliente principal está escrito en Java y, en la implementación actual, es lento. Con el crecimiento del índice local, el consumo de memoria aumenta significativamente y la velocidad de trabajo disminuye. La comprobación de una base de datos local de ~20 GB puede tardar unos segundos antes de que la solicitud se envíe a otros pares.
- La red pública "freeworld" actualmente tiene relativamente pocos nodos "activos" "senior" (manteniendo el índice de búsqueda acumulado y respondiendo a solicitudes de búsqueda de otros nodos) para búsquedas en la World Wide Web, y pueden producir relativamente pocos resultados en comparación con los grandes. los motores de búsqueda. Hay hasta varias decenas de millones de registros por nodo, por lo que su movimiento completo entre nodos lleva una cantidad significativa de tiempo, y el cierre abrupto o la adición de una cantidad significativa de nodos puede degradar temporalmente la calidad de la red para algunas consultas de búsqueda. como sucedió después del lanzamiento de la versión 1.0 en noviembre de 2011, cuando el número de participantes aumentó rápidamente a alrededor de 4000 [4] o 1000 [5] . A principios de marzo de 2012, alrededor de 1/6 de los nodos que trabajaban simultáneamente estaban "activos".
Programa
El motor de búsqueda es diferente de otros motores de búsqueda: no es un servidor central, sino un programa de cliente de red punto a punto que se ejecuta en muchas computadoras al mismo tiempo. Los resultados de la búsqueda se muestran como una página web en el sitio web local , que también actúa como una interfaz web para personalizar el motor de búsqueda según las necesidades del usuario.
En combinación con sistemas P2P adicionales, se utiliza un proxy que indexa automáticamente las páginas visitadas. La indexación no se realiza en los casos en que los datos se transmiten a través de GET o POST, o se utilizan cookies (cookies) o autenticación HTTP (por ejemplo, páginas incluidas en una zona protegida por contraseña específica). [6] Esto garantiza que solo se indexen los datos disponibles públicamente.
Otras características
- YaCy proporciona a todos los usuarios una función de proxy que les permite conectarse también a otros hosts en HOSTNAME.yacy o HASHNAME.yacyh. www.HODENAME.yacy puede ser la página principal del usuario, bajo share.HODENAME.yacy es un sitio para compartir archivos, y HOSTNAME.yacy es la interfaz de acceso estándar. Se pueden crear otros subdominios especialmente creando una carpeta con el nombre del subdominio. El DNS dinámico no es compatible.
- Además del dominio .yacy , YaCy brinda la capacidad de crear una página de inicio y carpetas que se pueden asociar con la IP actual o la dirección DNS dinámica y que son accesibles para usuarios que no son de Yacy.
- YaCy tiene una función de mensajería integrada que le permite enviar mensajes de texto (con formato wiki) así como transferir archivos.
- YaCy tiene un wiki y un blog incorporados .
- Existe la gestión de marcadores, que pueden ser públicos y privados.
- Es posible agregar ciertas áreas a listas negras.
- Hay una interfaz OpenSearch . Cada nodo lo pone a disposición en http://<node-address>:<node-port>/opensearchdescription.xml, por ejemplo https://web.archive.org/web/20120602233757/http://sciencenet.fzk. de:8080/opensearchdescription.xml . Para agregar su motor de búsqueda YaCy personal a la lista de motores de búsqueda de Firefox, debe abrir este archivo XML en un navegador y guardarlo en la carpeta "searchplugins", luego reinicie Firefox.
Tecnología
El programa se basa en un servidor web, que también es un proxy de almacenamiento en caché . El usuario del servidor web puede acceder al shell de búsqueda y administrar su propio host. El proxy tiene un código común con el escáner, lo que significa que todas las páginas visitadas a través de él, que no son personales, se registran automáticamente en el índice por defecto. Además, YaCy proporciona su propio dominio en la red YaCy, al que se puede acceder a través de un servidor proxy. Solr y Lucene están integrados para buscar en YaCy (para la versión 1.6, esta es la versión 4.3)
Índice distribuido
A diferencia de los servicios de intercambio de archivos, los resultados de búsqueda P2P deben estar disponibles de inmediato. Para lograr esto, YaCy utiliza una tabla hash distribuida (DHT). Esto significa que todas las URL y palabras reconocidas por el programa se envían a nodos que son adecuados para almacenar las correspondientes sumas de verificación de palabras, nodos o enlaces. Al buscar, funciona al revés: la búsqueda solo ocurre en los nodos que son adecuados para almacenar hashes de la URL para esa palabra.
Por lo tanto, solo se utiliza una parte de los nodos para obtener los resultados.
Tipos de nodos
La red YaCy consta de cuatro tipos diferentes de nodos:
novato
Estos nodos no se pueden encontrar porque el recién llegado no tiene conexión a la red. Por lo tanto, solo te ves a ti mismo si el nodo es nuevo.
jr
El anfitrión está detrás de un
cortafuegos . Otros lo clasifican como un nodo junior o potencial ,
[7] solo ven su última solicitud y no tienen forma de determinar si todavía está en línea.
Sénior
El anciano es accesible desde el exterior y es miembro pleno de la red YaCy. En las estadísticas de red, los nodos más antiguos que están funcionando actualmente se denominan activos , inactivos- pasivos .
[7]
Principal
Uno más antiguo que arroja una lista de semillas utilizadas para la conexión inicial a otros nodos.
Protocolo
El protocolo YaCy consta de servlets basados en texto proporcionados por el servidor web incorporado en /yacy/servletname.html. Otros hosts envían datos a través de parámetros GET y reciben una respuesta en texto sin formato, el formato exacto difiere para los servlets.
Bootstrap
Durante el arranque, el nodo intenta comunicarse con otros nodos en la red YaCy. Primero, se buscan listas de nodos. La primera dirección en superseed.txt se usa para descargar nodos YaCy estables. seed.txt son enlaces a otros nodos, entrando así en contacto con la red YaCy. La próxima vez que inicie YaCy, se creará gebootstrapt a partir de hosts conocidos de la ejecución anterior. En el futuro, las listas de nodos solo serán necesarias cuando la mayoría de los enlaces antiguos ya no estén disponibles.
Véase también
Notas
- ↑ El proyecto de código abierto de yacy en Open Hub: página de idiomas - 2006.
- ↑ GitHub (inglés) - 2007.
- ↑ Búsqueda web por la gente, para la gente: YaCy 1.0 . Fecha de acceso: 14 de diciembre de 2011. Archivado desde el original el 30 de noviembre de 2011. (indefinido)
- ↑ 1 2 3 YaCy Bugfix versión 1.01 con nuevas contribuciones de la comunidad . Consultado el 6 de marzo de 2012. Archivado desde el original el 12 de febrero de 2012. (indefinido)
- ↑ Estadísticas de cantidad: gráfico para 2011.
- ↑ Reino Unido: Privacidad - YaCyWiki (enlace descendente)
- ↑ 1 2 /Red.html
Literatura
- M. Christen: Peer-to-Peer: Eigenes Suchportal mit Yacy einrichten en iX 02/2008, S. 102 ff.
- M. Schlenker: Gemeinsam gegen Google en OpenSource , 01/2007, noviembre de 2006, S. 94-97
- J. Bager: Europäische Gegenströmung in c't, 2006/10, 2 de mayo de 2006, S.172-174 (Texto en línea )
- R. Sietmann: Wider die Monocultur. P2P-Strategien gegen die Suchmaschinen-Monopolisierung. en c't, 2005/16, 25 de julio de 2005, S.52-53 (Texto en línea )
- M. Schwarze: Jedermanns Suchmaschine en: HAZ ( Artikel als PDF 107 kB)
- Michael Christen: YaCy - Peer-to-Peer Web-Suchmaschine in Die Datenschleuder, #86, 2005, S.54-57 ( gesamtes Heft als PDF 1.7 MB)
Enlaces
en redes sociales |
|
---|
sitios temáticos |
|
---|
Buscadores y máquinas _ |
---|
General |
|
---|
Regional |
- Accoona (China/Estados Unidos)
- Alleba (Filipinas)
- Ansearch (Australia/EE.UU./Reino Unido/Nueva Zelanda)
- Aport (Rusia, cerrado)
- Daum (Corea del Sur)
- Guruji.com (India)
- [email protected] (Rusia)
- Maktoob (Bl. Este)
- META (Ucrania, cerrado)
- Miner.hu (Hungría)
- Najdi.si (Eslovenia)
- Onkosh (Bl. Este)
- Rambler-Poisk (Rusia, cerrado)
- Redif (India)
- SAPO (Portugal)
- Search.ch (Suiza)
- Sesam (Noruega/Suecia)
- Seznam.cz (República Checa)
- Sputnik (Rusia, cerrado)
- Walla! (Israel)
|
---|
lideres |
|
---|
Temático |
|
---|
Metabúsqueda |
- AskNet
- Impulso mental
- grumoso
- pila de perros
- exactous.ru
- Ecosia
- Excitar
- FarSEER
- robot caliente
- info.com
- Ixquick
- Krózilo
- Mamá
- metarastreador
- Metalib
- Nigma (cerrado)
- Búsqueda innumerable
- paso lateral
- cera de surf
- Turbo10
- rastreador web
- Búsqueda global de archivos
|
---|
abierto / gratis |
|
---|
Bebé |
- AGAKIDS (Rusia)
- Pregunta a los niños (Reino Unido)
- Frag Finn (Alemania)
- Niños AOL (EE. UU.)
- Niños Yahoo! (EE.UU)
- Quintura Children (Rusia)
- Familia Yandex (Rusia)
- Gogul (Rusia)
|
---|