Análisis de citas

El análisis de citas  es el estudio de la frecuencia, los patrones y los horarios de las citas en los documentos. Utiliza el patrón de citas, enlaces de un documento a otro documento, para descubrir las propiedades de los documentos. Un objetivo típico es identificar los documentos más importantes de una colección. Un ejemplo clásico es la cita entre artículos académicos y libros. [1] [2] Las decisiones judiciales en el ordenamiento jurídico anglosajón , con el fin de confirmar sus decisiones, se refieren a decisiones tomadas en casos anteriores, por lo que el análisis de la citación en un contexto legal es importante. Otro ejemplo son las patentes que contienen invenciones anteriores, patentes citadas anteriormente relacionadas con la reivindicación actual.

Los documentos se pueden asociar con muchas otras características además de las citas, como autores, editores, revistas, así como sus textos reales. El análisis general de colecciones de documentos se llama bibliometría , y el análisis de citas es una parte clave de esta dirección. Por ejemplo, la vinculación y el intercambio bibliográfico son métricas asociadas basadas en el análisis de citas (citas compartidas o citas compartidas). Las citas en una colección de artículos también se pueden presentar en la forma de los siguientes gráficos de citas, como señaló Derek de Solla Price  en el artículo de 1965 "Networks of Scientific Papers". [3] Esto significa que el análisis de citas se basa en aspectos del análisis de redes sociales y la ciencia de redes.

Un ejemplo temprano de indexación automática de citas fue CiteSeer , que se usó para citas en informes científicos, y Google Scholar es un ejemplo de un sistema moderno que incluye más que solo libros y artículos académicos y refleja una gama más amplia de fuentes de información. Hoy en día, la indexación de citas automatizada [4] ha cambiado la naturaleza de la investigación del análisis de citas, lo que permite analizar millones de citas para modelos a gran escala y descubrimiento de conocimiento. Los científicos pueden utilizar las herramientas de análisis de citas para calcular varios grados de impacto en función de los datos del índice de citas . [5] [6] [7] Tienen aplicaciones que van desde la identificación de jueces expertos hasta la revisión de documentos y propuestas de subvenciones, pasando por proporcionar datos transparentes para respaldar decisiones sobre mérito académico, permanencia en el cargo y toma de decisiones. Esta competencia por recursos limitados puede conducir a un comportamiento éticamente cuestionable para el aumento de las citas. [8] [9]

La práctica de utilizar ingenuamente el análisis de citas para comparar el impacto de diferentes artículos científicos sin tener en cuenta otros factores que pueden influir en los patrones de citas ha sido muy criticada. [10] Entre las críticas, una se centra constantemente en la "independencia de la industria", es decir, el hecho de que las prácticas de citación en un campo de la ciencia difieren de la práctica en otro e incluso entre ramas de investigación dentro de una disciplina. [once]

Resumen

Si bien los índices de citas se desarrollaron originalmente para la recuperación de información , se utilizan cada vez más para estudios bibliométricos  y de otro tipo relacionados con la evaluación de la investigación. Los datos de citas también son la base del coeficiente de influencia de una revista popular .

Existe una gran cantidad de literatura sobre el análisis de citas, a veces denominada cienciometría , un término  acuñado por Vasily Nalimov , o más específicamente bibliometría . La industria comenzó a florecer con la llegada del Science Citation Index, que cubre la literatura publicada desde 1900. Las revistas líderes de la industria son Scientometrics , Informatics y Journal of the Association for Information Science and Technology. Este último también organiza una lista de correo electrónico llamada Sigmetrica en ATIT. [12] Este método se está reviviendo a través de la adopción generalizada de bases de datos, suscripciones a Web Science y Scopus en muchas universidades, y herramientas públicas de citas gratuitas como CiteBase, CiteSeerX , Google Scholar y el antiguo programa Windows Live Academic (ahora disponible con funciones adicionales como como Microsoft Academic Search). Los métodos de investigación del análisis de citas incluyen enfoques cualitativos, cuantitativos y computacionales. Los enfoques principales de tales estudios cienciométricos han sido la evaluación comparativa del rendimiento, las clasificaciones de investigación institucional, la clasificación de revistas [13] con respecto al establecimiento de factores de rendimiento y estándares de propiedad, [14] la evaluación del impacto de los principales artículos científicos, [15] el seguimiento de la trayectoria de una ciencia o industria tecnológica [16] , y desarrollo de perfiles de autores e instituciones líderes en términos de resultados de investigación. [17]

El análisis de citas legales es una técnica de análisis de citas para analizar documentos legales que facilita la comprensión de documentos normativos relacionados mediante el examen de citas que vinculan una disposición con otras disposiciones en el mismo documento o entre diferentes documentos. El análisis de citas legales utiliza un gráfico de citas tomado de un documento normativo que puede complementar el descubrimiento electrónico, un proceso que influye en la innovación tecnológica en el análisis de big data . [18] [19] [20] [21]

Historia

En un artículo de 1965, Derek de Solla Price describió la propiedad vinculante inherente del SCI como "una red de artículos científicos". Los vínculos entre las citas y los artículos citados se volvieron dinámicos cuando SCI comenzó a publicar en línea. El Social Science Citation Index fue una de las primeras bases de datos instaladas en el sistema Dialog [22] en 1972. Con la llegada de los CD, las referencias se han vuelto aún más simples, lo que permite el uso de enlaces bibliográficos para encontrar registros relacionados. En 1973, Henry Small publicó su trabajo clásico sobre el análisis de citas conjuntas, que se convirtió en  un sistema de clasificación autoorganizado  que condujo a experimentos con agrupación de documentos y, finalmente, al Atlas de la ciencia, que luego se convirtió en Research Reviews.

Ralph Garner (Universidad de Drexel) describió en 1965 la naturaleza topológica y gráfica inherente de la red mundial de citas que es inherente a la literatura científica. [23]

El uso de puntajes de citas en revistas clasificadas era una práctica común en la primera mitad del siglo XIX, pero Eugene Garfield, del Instituto de Información Científica, quien también se convirtió en la fuente principal, inició la medición sistemática continua de estos puntajes para revistas académicas. por usar estos puntajes para calificar autores y artículos. En un artículo histórico de 1965, él e Irving Sher mostraron la relación entre la frecuencia y el crecimiento de las citas, demostrando que los ganadores del Premio Nobel publicaron sus artículos cinco veces en promedio, mientras que sus artículos fueron citados entre 30 y 50 veces en promedio. Garfield informó de este fenómeno en una larga serie de ensayos sobre el Nobel y otros premios. La puntuación final habitual se conoce como índice de influencia , el número de citas en la revista en los dos años anteriores dividido por el número de artículos publicados en esos años. Es ampliamente utilizado tanto para fines ordinarios como especiales, en particular, su uso para la evaluación de autores y documentos es bastante controvertido .

En un estudio de principios de 1964 que utilizó el análisis de citas para escribir la historia del ADN , Garfield y Sher demostraron el potencial para producir historiografía , mapas topológicos de los principales pasos en la historia de los temas científicos. Este trabajo fue posteriormente automatizado por E. Garfield, A. I. Pudovkin del Instituto de Biología Marina de la Academia Nacional de Ciencias y V. S. Istomin del Centro de Enseñanza, Aprendizaje y Tecnología de la Universidad Estatal de Washington y condujo a la creación del software Histcite [ 24] en 2002.

La indexación automática de citas fue introducida en 1998 por Lee Giles, Steve Lawrence y Kurt Bollacker y permitió la eliminación algorítmica automática y la agrupación de citas para cualquier documento académico y científico digital. Donde el retiro previo de citas era un proceso manual, las tasas de citas ahora pueden incrementarse y calcularse para cualquier rama o lugar académico, no solo aquellos asignados por organizaciones como ISI. Esto condujo a la creación de nuevos sistemas para indexar citas públicas y automáticas, el primero de los cuales fue CiteSeer (ahora CiteSeerX , pronto heredado por el sistema Cora, que se centró principalmente en informática y ciencias de la computación . Más tarde, los principales sistemas de nombres de dominio académicos como como Google Scholar y Microsoft Academic Esta indexación de citas fuera de línea aún no se ha perfeccionado en la extracción de citas o el agrupamiento de citas con una tasa de error estimada en alrededor del 10%, aunque aún no se ha realizado un muestreo estadístico cuidadoso. Autores como Ann Arbor , Milton Keynes y Walton Hall han producido una gran cantidad de resultados académicos.25 SCI afirma crear una indexación automática de citas a través de métodos puramente programáticos. Incluso las entradas más antiguas tienen el mismo margen de error.

Análisis de citas para documentos legales

El análisis de citas para documentos legales es un enfoque que ayuda a comprender y analizar documentos normativos relacionados mediante el examen de citas que vinculan una disposición con otras disposiciones dentro del mismo documento y entre diferentes documentos. El análisis de citas utiliza un gráfico de citas derivado de un documento normativo que podría complementar el descubrimiento electrónico, un proceso que impulsa la innovación tecnológica en el análisis de big data. [26]

Crítica

Publicaciones electrónicas . Debido al aumento sin precedentes en la disponibilidad de recursos electrónicos, una de las preguntas candentes que ahora se están estudiando se ha convertido en la pregunta "¿con qué frecuencia se citan los recursos electrónicos en Internet en mi industria?". [27] Por ejemplo, se ha argumentado que el acceso en línea a la literatura de ciencias de la computación conduce a tasas de citas más altas, [28] sin embargo , los artículos de humanidades pueden verse afectados si no existen impresos.

Autocitado . La práctica de los autores de “jugar” con el sistema acumulando citas, sobre citándose a sí mismos [29] , ha sido muy criticada . Al mismo tiempo, por ejemplo, se encontró que los hombres se citan a sí mismos con más frecuencia que las mujeres.

Véase también

Notas

  1. Rubín, Richard. Fundamentos de bibliotecología y ciencias de la información  (inglés) . — 3er. - Nueva York: Neal-Schuman Publishers, 2010. - ISBN 978-1-55570-690-6 .
  2. Garfield, E. Citation Indexing: su teoría y aplicación en ciencia, tecnología y humanidades Filadelfia: ISI Press, 1983. . Consultado el 29 de agosto de 2018. Archivado desde el original el 9 de marzo de 2018.
  3. Derek J. de Solla Price. Redes de artículos científicos  (inglés)  // Ciencia  : revista. - 1965. - 30 de julio ( vol. 149 , núm. 3683 ). - Pág. 510-515 . -doi : 10.1126 / ciencia.149.3683.510 . - . — PMID 14325149 .
  4. Giles, C. Lee; Bollacker, Kurt D. & Lawrence, Steve (1998), CiteSeer: un sistema automático de indexación de citas. , Bibliotecas digitales 98: la Tercera Conferencia ACM sobre Bibliotecas Digitales, 23–26 de junio de 1998, Pittsburgh, PA (Nueva York: Association for Computing Machinery): 89–98, ISBN 0-89791-965-3 , doi : 10.1145/ 276675.276685 , < http://doi.acm.org/10.1145/276675.276685 > . Consultado el 7 de julio de 2011. 
  5. Los ejemplos incluyen herramientas basadas en suscripción basadas en datos propietarios, como Web of Science y Scopus , y herramientas gratuitas basadas en datos abiertos, como Scholarometer. Archivado el 18 de abril de 2022 en Wayback Machine por Filippo Menczer y su equipo.
  6. Kaur, Jasleen. Scholarometer: un marco social para analizar el impacto entre disciplinas  (inglés)  // PLoS ONE  : revista. - 2012. - vol. 7 , núm. 9 _ - doi : 10.1371/journal.pone.0043235 . - . —PMID 22984414 .
  7. Hoang, D.; Kaur, J. & Menczer, F. (2010), Crowdsourcing Scholarly Data , Proceedings of the WebSci10: Extending the Frontiers of Society On-Line, 26 y 27 de abril de 2010, Raleigh, NC: EE. UU ., < http:/ /diario.webscience.org/321/ > . Consultado el 29 de agosto de 2018. Archivado el 17 de abril de 2015 en Wayback Machine . 
  8. Anderson, furgoneta MS.  Los efectos perversos de la competencia en el trabajo y la relación de los  científicos // Ética de la ciencia y la ingeniería : diario. - 2007. - vol. 4 , núm. 13 _ - Pág. 437-461 . -doi : 10.1007/ s11948-007-9042-5 .
  9. Wesel, M. van. Evaluación por citación: tendencias en el comportamiento de publicación, criterios de evaluación y la lucha por publicaciones de alto impacto   // Ética de la ciencia y la ingeniería : diario. - 2016. - Vol. 22 , núm. 1 . - pág. 199-225 . -doi : 10.1007/ s11948-015-9638-0 . —PMID 25742806 .
  10. ¿Qué miden los recuentos de citas? Una revisión de los estudios sobre el comportamiento de citación  //  Journal of Documentation : diario. - 2008. - Vol. 64 , núm. 1 . - P. 45-80 . -doi : 10.1108/ 00220410810844150 .
  11. Anauati, Maria Victoria and Galiani, Sebastian and Gálvez, Ramiro H., Quantifying the Life Cycle of Scholarly Articles Across Fields of Economic Research (11 de noviembre de 2014). Disponible en SSRN: http://ssrn.com/abstract=2523078 Archivado el 17 de noviembre de 2014.
  12. La Sociedad Estadounidense de Ciencia y Tecnología de la Información (enlace inaccesible) . La sociedad de la información para la era de la información . Consultado el 21 de mayo de 2006. Archivado desde el original el 3 de octubre de 2019. 
  13. Lowry, Paul Benjamín; Moody, Gregory D.; Gaskin, James; Galletta, Dennis F.; Humpherys, Sean; Barlow, Jordan B.; y Wilson, David W. (2013). " Evaluación de la calidad de las revistas y la canasta de revistas de la Asociación de Sistemas de Información (AIS) para académicos superiores a través de medidas bibliométricas: ¿las evaluaciones de revistas expertas agregan valor? Archivado el 21 de marzo de 2019 en Wayback Machine , MIS Quarterly (MISQ), vol. 37(4) , 993 a 1012. Además, YouTube puede ver la narración en video de este artículo en: https://www.youtube.com/watch?v=LZQIDkA-ke0&feature=youtu.be Archivado el 21 de marzo de 2019 en Wayback Machine .
  14. Decano, Douglas L; Lowry, Paul Benjamín; y Humpherys, Sean (2011). Perfilando la productividad de investigación de profesores titulares de sistemas de información en instituciones de EE . UU. Archivado el 9 de enero de 2016 en Wayback Machine , MIS Quarterly (MISQ), vol . 35(1), págs. 1-15 ( ISSN 0276-7783 ).
  15. Karuga, Gilbert G.; Lowry, Paul Benjamín; y Richardson, Vernon J. (2007). Evaluación del impacto de la investigación de sistemas de información de primer nivel a lo largo del tiempo, Communications of the Association for Information Systems, vol. 19(7), págs. 115-131 (http://aisel.aisnet.org/cais/vol19/iss1/7) Archivado el 25 de enero de 2016 en Wayback Machine .
  16. Liu, John S. Un enfoque integrado para el análisis de la ruta principal: desarrollo del índice de Hirsch como ejemplo  //  Revista de la Sociedad Estadounidense de Ciencia y Tecnología de la Información : diario. - 2012. - 1 de marzo ( vol. 63 , no. 3 ). - Pág. 528-542 . — ISSN 1532-2890 . -doi : 10.1002/ asi.21692 .
  17. Lowry, Paul Benjamín; Karuga, Gilbert G.; y Richardson, Vernon J. (2007). Evaluación de instituciones, profesores y artículos líderes en revistas de investigación de sistemas de información de primer nivel, Communications of the Association for Information Systems, vol. 20(16), págs. 142-203 (http://aisel.aisnet.org/cais/vol20/iss1/16). Archivado el 9 de enero de 2016 en Wayback Machine .
  18. http://ieeexplore.ieee.org/search/wrapper.jsp?arnumber=5070630&tag=1  (enlace descendente al 29/08/2018 [1517 días])
  19. Mohammad Hamdaqa y A. Hamou-Lhadj, "Análisis de citas: un enfoque para facilitar la comprensión y el análisis de los documentos de cumplimiento normativo", en proceso. de la 6ª Conferencia Internacional de Tecnologías de la Información, Las Vegas, EE.UU.
  20. Informe especial de descubrimiento electrónico: La marea creciente de la revisión no lineal . Hudson Global . Consultado el 1 de julio de 2012. Archivado desde el original el 3 de julio de 2012. por Cat Casey y Alejandra Pérez
  21. Lo que nos enseña el descubrimiento electrónico asistido por tecnología sobre el papel de los seres humanos en la tecnología: rehumanización de la revisión asistida por tecnología . Forbes . Consultado el 1 de julio de 2012. Archivado desde el original el 18 de junio de 2012.
  22. Diálogo, Un negocio de Thomson . "Diálogo inventó los servicios de información en línea" . Consultado el 21 de mayo de 2006. Archivado desde el original el 13 de enero de 2004.
  23. Copia archivada . Consultado el 29 de agosto de 2018. Archivado desde el original el 9 de septiembre de 2017.
  24. Eugene Garfield Algorithmic Citation-Linked Historiography—Mapping the Literature of Science . Presentó el ASIS&T 2002: Información, Conexiones y Comunidad. 65a Reunión Anual de ASIST en Filadelfia, PA. 18-21 de noviembre de 2002 (2002). Consultado el 21 de mayo de 2006. Archivado desde el original el 20 de octubre de 2016.
  25. Postellon DC Hall y Keynes se unen a Arbor en los índices de citas  // Nature  :  journal. - 2008. - marzo ( vol. 452 , núm. 7185 ). -doi : 10.1038/ 452282b . — . — PMID 18354457 .
  26. Hamdaqa, M.; A Hamou-Lhadj. Análisis de citas: un enfoque para facilitar la comprensión y el análisis de los  documentos de cumplimiento normativo . - Las Vegas, NV: Instituto de Ingenieros Eléctricos y Electrónicos , 2009. - P. 278-283. - ISBN 978-1-4244-3770-2 . -doi : 10.1109/ ITNG.2009.161 .
  27. Zhao, Lisa. "Cómo el bibliotecario usó los recursos electrónicos: un análisis de las citas en CCQ". Catalogación y Clasificación Trimestral 42(1) (2006): 117-131.
  28. Lorenzo, Steve. La disponibilidad gratuita en línea aumenta sustancialmente el impacto de un periódico. Nature volumen 411 (número 6837) (2001): 521. También en línea en http://citeseer.ist.psu.edu/online-nature01/ Archivado el 9 de junio de 2010 en Wayback Machine .
  29. Gálvez RH Evaluación de la autocita de autor como mecanismo de difusión de conocimiento relevante  //  Scientometrics : revista. - 2017. - marzo ( vol. 111 , no. 3 ). - Pág. 1801 . -doi : 10.1007/ s11192-017-2330-1 .