Búsqueda de código de Google

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 25 de diciembre de 2021; las comprobaciones requieren 3 ediciones .
Búsqueda de código de Google
URL http://www.google.com/codesearch (copia de seguridad)
tipo de sitio Búsqueda de código fuente
Dueño Google
Comienzo del trabajo 2006 [1]
Fin del trabajo 2012 [2]
Estado actual Se utiliza para buscar dentro de proyectos alojados en Google Code

Google Code Search  es un proyecto de un motor de búsqueda de Google Labs que indexaba los códigos fuente de los programas de código abierto y permitía el uso de expresiones regulares en las consultas de búsqueda [1] . Funcionó como versión beta desde el 5 de octubre de 2006 hasta el 15 de enero de 2012 [2] . Cerrado debido al cierre de Google Labs .

Además de admitir expresiones regulares [1] , existía la posibilidad de una búsqueda más precisa utilizando operadores especiales. Entre ellos: lang: (indicando el lenguaje de programación [1] ), paquete: (nombre del proyecto), licencia: (licencia [1] ) y archivo: (nombre del archivo).

Se indexó el código de los programas almacenados en varios formatos, incluidos los repositorios tar.gz, tar.bz2, .tar, .zip, CVS y Subversion .

Hasta cierto punto, Google Code Search se sigue utilizando para buscar dentro de los códigos del proyecto Chromium, cuyo código se encuentra en el sitio web de Google Code . [3]

El autor del proyecto, Russ Cox, ha publicado un par de utilidades de consola Cindex/Csearch que brindan la capacidad de indexar y buscar a través de códigos fuente. Las utilidades utilizan principios similares a los de Google Code Search, aunque no pueden escalar más de unas pocas decenas de gigabytes de código fuente. [cuatro]

Motor de expresiones regulares

El sitio permitía el uso de expresiones regulares en las consultas y buscaba cualquier carácter (a diferencia de los motores de búsqueda regulares, que ignoran los caracteres que no son de texto [5] ). En el momento de su creación, otros motores de búsqueda no tenían tales capacidades . Esto hizo que pareciera grep , que busca a través de una enorme base de datos de código fuente abierto . La búsqueda se basa en el índice de trigramas y en la propia implementación de POSIX ( expresiones regulares compatibles) de Russ Cox, RE2. [6] El código fuente de RE2 se publicó en marzo de 2010. [7]

Google Code Search admite la sintaxis de expresiones regulares extendidas de POSIX , excepto las referencias inversas , la coincidencia de elementos y la clasificación de clases. [ocho]

Datos interesantes

Notas

  1. 1 2 3 4 5 Ed Burnette. Google: Búsqueda de código y películas y gadgets, ¡vaya!  (Inglés) . Conexión ZDNet Dev (5 de octubre de 2006). - Búsqueda de código. Esto es para que los desarrolladores los ayuden a encontrar código fuente abierto. Las funciones incluyen la capacidad de buscar por expresiones regulares (go{2}gle), por idioma (lang:"c++" sprintf.*%s) o por licencia (-license:gpl quicksort).". Consultado el 17 de noviembre de 2013.
  2. 1 2 Google cierra diez servicios Archivado el 4 de marzo de 2016 en Wayback Machine // The Register, 2011-09-05
  3. Búsqueda de código Archivado el 3 de junio de 2016 en Wayback Machine para el proyecto Chromium.
  4. Cindex/Csearch Archivado el 5 de noviembre de 2013 en Wayback Machine  : herramienta de búsqueda de archivos de línea de comandos, basada en ideas de GCS
  5. A Big Loss Archivado el 11 de mayo de 2014 en Wayback Machine .
  6. Coincidencia de expresiones regulares con un índice de trigramas o cómo funcionaba la búsqueda de código de Google , Russ Cox, enero de 2012
  7. Blog de código abierto de Google: RE2: un enfoque basado en principios para la coincidencia de expresiones regulares (enlace descendente) . Fecha de acceso: 22 de enero de 2013. Archivado desde el original el 3 de febrero de 2013. 
  8. Búsqueda de código de Google: preguntas frecuentes // Google, archivado en 2008
  9. Nik Cubrilovic . Google Now muestra resultados de búsqueda de código  (inglés) , Washington Post (13 de julio de 2008). Archivado desde el original el 17 de noviembre de 2013. Consultado el 17 de noviembre de 2013.
  10. PJ Plauger, Abandoning a Process Archivado el 20 de enero de 2022 en Wayback Machine , ISO/IEC JTC1 SC22 WG14 N1327: "mientras no haya eventos de salida rápida en una búsqueda de código de Google".
  11. Johnny Long. Localización de código con Google Code Search // Google Hacking para Penetration Testers, Volumen 2 . - Syngress, 2011. - S. 227-230. — 560 págs.
  12. Google Code Search les da a los expertos en seguridad una sensación de hundimiento Archivado el 14 de julio de 2013 en Wayback Machine // Dennis Fisher, editor ejecutivo, TechTarget, 11 de octubre de 2006
  13. Bill Brener . Registro del blog de seguridad: dando un giro a la búsqueda de códigos de Google , TechTarget (13 de octubre de 2006). Archivado desde el original el 13 de julio de 2013. Consultado el 17 de noviembre de 2013.
  14. insecurity stats via google codesearch Archivado el 10 de junio de 2015 en Wayback Machine . Archivado el 10 de junio de 2015. // Blog de José

Enlaces