Coeficiente Jaccard

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 21 de septiembre de 2020; las comprobaciones requieren 2 ediciones .

La medida Jaccard (coeficiente de comunidad florística, francés  coeficiente de communaute , alemán  Gemeinschaftskoeffizient ) es una medida binaria de similitud , propuesta por Paul Jaccard en 1901. [1]  : , donde a  es el número de especies en la primera parcela de prueba, b  es el número de especies en la segunda parcela de prueba, c  es el número de especies comunes a la primera y segunda parcelas. Este es el primer coeficiente de similitud conocido.. El apellido del autor del coeficiente en la literatura también se tradujo como Jacquard o Jacquard. El coeficiente de Jaccard en varias modificaciones y registros se usa activamente en ecología, geobotánica, biología molecular , bioinformática , genómica , proteinómica, informática y otras áreas. La medida de Jaccard es equivalente (relacionada por una dependencia monótonamente creciente) a la medida de Sørensen y la medida de Sokal-Sneath para conjuntos finitos (interpretación múltiple):

Una medida de diferencia que es el complemento a 1 del coeficiente de similitud de Jaccard se denomina medida de contraste florístico [2] [3] . Para el caso de conjuntos descriptivos (interpretación descriptiva), en ecología son muestras por abundancia , el análogo de esta medida es la medida de Ruzicka [4] :

.

En un caso particular, cuando se utilizan componentes de vectores booleanos, es decir, componentes que toman solo dos valores 0 y 1, la medida se conoce como coeficiente de Tanimoto o coeficiente de Jaccard extendido [5] . Si los objetos se comparan por la ocurrencia de especies (interpretación probabilística), es decir, se tienen en cuenta las probabilidades de encuentros, entonces el análogo de la medida de Jaccard será la medida de probabilidad de Iversen [6] :

.

Para la interpretación analítica informativa, se utiliza la medida de interdependencia de Raisky [7] [8] [9] :

La medida de diferencia que es coequivalente a la medida de similitud de Jaccard es la distancia:

Véase también

Literatura

  1. Jaccard P. Distribution de la flore alpine dans le Bassin des Dranses et dans quelquesregions voisines // Bull. soc. Ciencia vaudoise. Naturaleza 1901. V. 37. Bd. 140. Art. 241-272.
  2. Mirkin B. M., Rosenberg G. S. Diccionario explicativo de fitocenología moderna. — M.: Nauka, 1983. — 134 p.
  3. Mirkin B. M., Rosenberg G. S., Naumova L. G. Diccionario de conceptos y términos de fitocenología moderna. — M.: Nauka, 1989. — 223 p.
  4. Ružička MK Anwendung mathematiseh-statistiseher Methoden in der Geobotanik (sintetischa Bearbeitung von Aufnahmen) // Biología. 1958. Roc. 13.ch. 9. S. 647-661.
  5. Tanimoto TT Informe interno de IBM 17 de noviembre. 1957.
  6. Iversen J. Über die Korrelationen zwischen den Pflanzenarten in einem grönlandischen Talgebiet // Vegetation. 1954. V. 5-6. págs. 238-246.
  7. Raijski C. Un espacio métrico de distribuciones de probabilidad discretas // Información y control. 1961. V. 4. No. 4. P. 371-377.
  8. Raijski C. Entropía y espacios métricos // C. Cherry (ed.). Teoría de la información. Londres: Butterworths, 1961, págs. 41-45.
  9. Eliseeva I. I., Rukavishnikov V. O. Agrupación, correlación, reconocimiento de patrones: (métodos estadísticos para clasificar y medir relaciones). — M.: Estadísticas, 1977. — 143 p.