Google Académico | |
---|---|
URL | erudito.google.com |
Comercial | No |
tipo de sitio | Búsqueda por publicaciones científicas |
Registro | Opcional |
Idiomas) | 40 idiomas soportados |
Dueño | |
Comienzo del trabajo | 20 de noviembre de 2004 |
Estado actual | Obras |
Archivos multimedia en Wikimedia Commons |
Google Scholar es un motor de búsqueda gratuito de publicaciones de investigación lanzado en noviembre de 2004 por iniciativa de los ingenieros de Google Alex Verstak y Anurag Acharya . Con la ayuda de robots de búsqueda , el portal indexa metadatos y realiza búsquedas de texto completo en literatura científica, incluidos artículos de revistas, preprints , disertaciones, libros e informes técnicos. Los usuarios pueden buscar los trabajos deseados por autores, palabras clave, título de la revista. La búsqueda en profundidad le permite clasificar los materiales por publicación, fecha y área temática.
Google Academy no proporciona datos sobre el número exacto de obras indexadas, sin embargo, según estimaciones preliminares, hubo al menos 390 millones en 2019. A pesar de la falta de datos confiables sobre el tamaño de la base de datos, el portal es considerado el más grande del mundo. motor de búsqueda académico más grande, con un alcance de hasta el 90 % de todos los artículos en inglés.
La idea de crear Google Academy pertenece a Alex Verstak y Anurag Acharya . A principios de la década de 2000, los ingenieros colaboraron para mejorar la indexación de publicaciones científicas basada en la web de Google . Posteriormente, decidieron crear un buscador similar de literatura científica [1] [2] [3] . Según Acharya, concibió un proyecto similar mientras aún estudiaba en el Instituto Indio de Tecnología . Luego, el ingeniero se encontró por primera vez con el problema de los paywalls , debido a que los artículos científicos no entraban en los resultados de búsqueda, y los científicos tuvieron que hacer un doble trabajo para compilar una revisión de la literatura [4] [5] [3] [6] . Workbench y Acharya buscaban facilitar el acceso al conocimiento científico. El eslogan de la Google Academy era la frase " De pie sobre los hombros de gigantes ", atribuida a Bernardo de Chartres e Isaac Newton [7] .
El motor de búsqueda gratuito se lanzó en 2004 [5] [8] [5] . En el momento de su creación, Google Scholar indexaba artículos de las bases de datos de las revistas Nature , Online Computer Library Center , Association for Computing Machinery y otras [9] . Al mismo tiempo, faltaban algunas funciones básicas, como filtrar datos por fecha [10] .
En 2006, Google Scholar agregó una nueva función que genera e importa automáticamente citas bibliográficas de trabajos académicos indexados en sistemas comerciales de administración de información bibliográfica , incluidos RefWorks , Reference Manager , EndNote y BibTeX [7] . De 2007 a 2011, el enlace de Google Scholar estaba en la página de inicio de Google [11] . En 2007, en acuerdo con las editoriales, el servicio lanzó un programa para digitalizar revistas científicas. Su principal objetivo era acceder a los metadatos de las publicaciones para facilitar el proceso de búsqueda, identificación y citación [7] . En 2010, Google Scholar anunció una nueva característica - "despertador" para ciertas solicitudes - los usuarios podían recibir actualizaciones sobre nuevas publicaciones por correo [12] [13] . Desde 2012, los investigadores han podido crear perfiles personales, agregar de forma independiente y actualizar regularmente información sobre todos los trabajos publicados. Al mismo tiempo, el servicio calcula automáticamente indicadores cienciométricos individuales [7] . La opción no solo mejoró las capacidades de búsqueda del sistema, sino que también hizo posible el seguimiento de las carreras individuales de los investigadores [1] . En 2013, el servicio conectó la función de una biblioteca personal para colecciones de literatura científica y resultados de búsqueda para ciertas consultas en una cuenta personal [7] .
En mayo de 2014, Google Scholar fue bloqueado en China [14] . Muchos científicos chinos han declarado que el confinamiento afectará negativamente el desarrollo de la ciencia en el país [15] [16] .
En 2021, el portal introdujo una función adicional para realizar un seguimiento de la legibilidad de los trabajos de investigación que se rigen por mandatos de acceso abierto, una política de los donantes que exige a los investigadores que abran su trabajo a través del archivo en repositorios [17] [18] .
Los robots de búsqueda de Google Academy escanean constantemente la web y agregan automáticamente materiales que son adecuados en contenido y diseño para el formato de un artículo científico [1] . Así, artículos de noticias, libros, reseñas, sitios comerciales, blogs y páginas de Wikipedia no están sujetos a indexación [19] . Los robots de búsqueda escanean materiales de dos grupos principales de fuentes. El primero incluye publicaciones de revistas, preprints , disertaciones e informes técnicos. Los materiales identificados de esta manera incluyen tanto documentos de texto completo como citas con anotaciones. El segundo grupo incluye materiales proporcionados por organizaciones asociadas: editores de revistas, sociedades científicas, proveedores de bases de datos e instituciones de investigación. La mayoría de estos trabajos se presentan en Google Scholarship como citas con anotaciones, ya que el texto completo aún está oculto detrás de los muros de pago [20] [21] [22] [23] .
Los robots de búsqueda tienen acceso a las bases de datos más grandes de editoriales universitarias y científicas comerciales, incluida la Association for Computing Machinery , Nature , Institute of Electrical and Electronics Engineers , Online Computer Library Center , Macmillan Publishers , John Wiley & Sons , University of Chicago Press [5 ] . Además, los robots también escanean sus hosts digitales, incluidos HighWire Press , Metapress , Ingenta , sitios web de instituciones científicas y gubernamentales como la American Physical Society , los Institutos Nacionales de Salud de EE . UU. , National Oceanic y Administración atmosférica y servidores de preimpresión como arXiv.org , Sistema de información astrofísica de la NASA , RePEc y Citebase [24] [25] [22] . En 2007, Elsevier también puso su base de datos ScienceDirect a disposición de Google [26] .
En algunos casos, Google Scholar también indexa sitios web. Para hacer esto, los portales deben cumplir con ciertos criterios: publicar principalmente artículos científicos (artículos de investigación originales, informes técnicos, publicaciones en revistas, actas de congresos, disertaciones y resúmenes), estar en acceso público y también seguir todas las recomendaciones técnicas necesarias [27] .
El sistema no proporciona datos sobre el número exacto de obras indexadas, por lo que los investigadores se ven obligados a realizar sus propias valoraciones. Presuntamente, en 2010, la cantidad de documentos agregados a Google Scholar fue de aproximadamente 82 millones, en 2014: 99.3-109.3 millones, en 2015: 160-165 millones y en 2019: más de 390 millones [28] [29] . A pesar de la falta de datos confiables sobre el tamaño de la base de datos, Google Scholar es considerado el motor de búsqueda académico más grande del mundo, con una tasa de cobertura de hasta el 90 % de todos los artículos en inglés y el 50 % de todos los documentos de texto completo [25]. ] [30] [6] [31] [21] [32] .
Los rastreadores de Google Academy indexan trabajos académicos de todos los idiomas y disciplinas [27] [21] . La mayor parte del contenido indexado se almacena en los servidores del editor, donde los documentos de texto completo están disponibles para su descarga paga [8] .
Para estudiar la estructura de enlaces de un artículo y determinar su "importancia", Google Scholar utiliza algoritmos similares a PageRank [ 33] . Los rastreadores extraen datos bibliográficos e información de citas, que luego se utilizan para clasificar los resultados de búsqueda. El algoritmo otorga el mayor peso al número de citas de un trabajo científico: cuantas más haya, más alto se mostrará el artículo en los resultados de búsqueda. Esto es diferente del enfoque de la mayoría de las bases de datos científicas similares que utilizan el orden cronológico inverso [23] . La calidad de las obras citadas también juega un papel importante; por lo tanto, si una publicación es referenciada por materiales con una calificación alta, su posición en los resultados de búsqueda también crece [34] [35] . El motor de búsqueda clasifica los resultados de la búsqueda y el grado de relevancia para la consulta. La presencia de palabras clave en el título del trabajo tiene un impacto significativo en la posición del artículo en la lista. En este caso, la frecuencia de aparición de las palabras clave de consulta en el texto completo no importa [36] [37] [27] . La antigüedad del artículo tampoco juega un papel importante para el algoritmo [38] .
Organizaciones individuales, incluidas Elsevier, OpenScience, Mendeley, SAGE Publishing, aconsejan a los autores que sigan los principios de optimización de motores de búsqueda y modifiquen su trabajo de tal manera que sea más fácil para los motores de búsqueda académicos rastrearlo e indexarlo [39] . También se recomienda a los autores que adapten sus textos de forma independiente a los estándares de Google Scholar para que el mayor número posible de personas pueda acceder a ellos [40] [41] [42] .
La función de seguimiento de citas apareció en Google Scholar en diciembre de 2004, casi inmediatamente después del lanzamiento de la plataforma [43] [44] . Los investigadores a menudo se basan en una puntuación de citas, el factor de impacto , para realizar un seguimiento de los artículos más influyentes sobre un tema en particular [22] [23] . La función permitió a Google Scholar competir con los motores de búsqueda de pago de los editores tradicionales. Antes de esto, solo el portal Web of Science de Thomson Scientific [23] [22] [21] [45] ofrecía esta opción .
Google Scholar calcula y muestra automáticamente tres métricas de citas de autor [25] :
La interfaz de Google Scholar es similar a la página de inicio de Google. Los usuarios pueden buscar por autores, palabras clave, títulos de revistas. La búsqueda avanzada le permite filtrar los resultados por revistas específicas, fecha y área temática [46] [47] . Después de ingresar una consulta, el portal devuelve hasta 1000 resultados, cada uno de los cuales contiene datos bibliográficos (título, nombres de los autores, fuente de publicación), así como enlaces a un resumen o una versión completa del trabajo, si está en el dominio publico Los usuarios pueden ver citas de la publicación de otras fuentes, enlaces a recursos en línea donde se presenta el material oa bibliotecas que tienen una copia física del trabajo. En este caso, no se muestra el identificador digital del objeto . Google Scholar brinda a los usuarios acceso a múltiples versiones del mismo documento [46] [21] .
La función Mi biblioteca le permite "guardar" colecciones personales de artículos que se pueden organizar mediante etiquetas. Los usuarios pueden generar referencias bibliográficas a cualquier artículo científico. El sistema genera referencias en todos los estándares bibliográficos internacionales más utilizados, como estilo MLA Modern Language Association , estilo APA , estilo Turabian (Chicago) [ , estilo Harvard , estilo American Chemical Society , estilo AIP American Institute of Physics, estilo IEEE , estilo Vancouver y otros [7] . El portal también le permite importar citas para programas como EndNote, BibTeX, RefMan o RefWorks. Los usuarios pueden configurar y editar perfiles de autor, incluso especificar su afiliación institucional, cinco áreas de interés científico y agregar publicaciones. Sin embargo, solo los perfiles con direcciones de correo electrónico académicas verificadas se muestran en los resultados de búsqueda. También es posible suscribirse a las actualizaciones de otros autores para recibir notificaciones por correo electrónico de nuevos artículos o citas [25] .
Los científicos modernos llaman al surgimiento de Google Academy una revolución en el campo de la búsqueda de literatura científica. Según diversas fuentes, el portal es utilizado por el 43,7% al 88% de los investigadores. Google Scholar reduce la posibilidad de duplicación involuntaria de la investigación, lo que es especialmente importante para áreas de la ciencia con un alto costo de experimentación, como la física y la medicina [4] [47] [48] [49] [50] [28] .
La difusión de Google Scholar ha aumentado la importancia de las revistas científicas "sin prestigio" y los artículos antiguos. Esto puede explicarse por la influencia del algoritmo de ranking, que prioriza la relevancia de los trabajos a la solicitud del usuario, y no el elitismo de la revista en la que se publican. Los artículos antiguos tienen más ventajas porque el sistema se centra en los artículos con más citas [50] [51] [52] .
La funcionalidad de Google Academy contribuyó a la popularización del uso de indicadores cienciométricos para evaluar el trabajo de los investigadores: muchos empleadores comenzaron a confiar en ellos al evaluar candidatos [48] . El motor de búsqueda también ha tenido un impacto en el movimiento de acceso abierto . A través de la colaboración con los principales editores, Google Scholar impulsó a los editores comerciales a digitalizar los resúmenes de los documentos de pago; antes de eso, los resúmenes no estaban disponibles para su visualización y los usuarios solo podían verlos al obtener acceso completo al documento [4] .
Muchos investigadores advierten contra el uso de Google Scholar como única fuente para revisar la literatura científica. Las razones de esto son las fallas en el algoritmo de clasificación, que a veces muestra resultados inexactos, errores de catalogación, atribución de citas erróneas o la inclusión de material no estrictamente académico. La cobertura de las obras indexadas también se limita al acceso a determinadas organizaciones y está sujeta a un acuerdo con los editores [28] . La búsqueda de becas de Google no es reproducible ni transparente: las consultas repetidas a menudo arrojan resultados diferentes [53] [54] [31] . Además, las revistas indexadas no están sujetas a verificación manual, lo que conduce a la entrada en la base de datos de revistas depredadoras [55] . Además, un estudio de 2021 encontró un sesgo lingüístico en el algoritmo de Google Academy: los documentos publicados en idiomas distintos del inglés se relegan sistemáticamente a posiciones que los hacen casi invisibles [56] .
La difusión de Google Scholar ha contribuido al efecto Matthew : un número relativamente pequeño de publicaciones atrae un número desproporcionadamente creciente de citas, mientras que la mayoría de los demás trabajos pasan desapercibidos [57] . Esto se debe a que los investigadores continúan seleccionando artículos de los mejores resultados, asumiendo automáticamente su validez (por ejemplo, en base a una gran cantidad de citas anteriores), y también los citan en sus artículos [58] [59] . Sin embargo, el algoritmo de clasificación de Google Academy tiene una serie de vulnerabilidades. Los investigadores han experimentado con la manipulación de sus propios rankings de citas individuales agregando palabras invisibles a la portada de uno de sus trabajos de conferencia y cambiando el contenido y la bibliografía de algunos de sus trabajos ya publicados. Esto dio como resultado un aumento en las citas y mejores puntajes individuales [60] [61] . Además, la promoción de puntajes de citas individuales por parte del portal conduce potencialmente a un deterioro en la calidad de los artículos científicos, ya que los investigadores están más preocupados por los puntajes de citas individuales que por el contenido [62] .