Medida de inclusión

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 9 de junio de 2021; la verificación requiere 1 edición .

Las medidas de inclusión son medidas de similitud  asimétrica que reflejan el grado de proximidad de un objeto en relación con otro. No tiene sentido utilizar medidas de inclusión por separado. Las medidas de inclusión también se conocen como medidas asimétricas, medidas de convergencia direccional. Las medidas de inclusión reflejan relaciones todo-parte. También existe el concepto de medidas de no inclusión, que se definen como la suma de medidas de inclusión a 1. Por lo general, las medidas de inclusión se representan como una matriz de inclusión

Cabe destacar especialmente que las medidas de inclusión son más informativas en general, y especialmente para objetos de diferentes tamaños en cuanto al número de características, que las medidas de similitud, ya que estas últimas, de hecho, son indicadores medios y, por tanto, pierden algo de información. sobre los objetos, y las medidas de inclusión asimétrica evalúan adecuadamente las relaciones no transitivas que son más comunes en la naturaleza. Por ejemplo, una lista puede estar incluida al 100 % en otra lista, y la otra lista, a su vez, puede estar incluida solo al 10 %. Al mismo tiempo, el coeficiente de similitud no podrá reflejar adecuadamente estas relaciones, ya que, por ejemplo, 10 especies comunes son significativas para una lista de 10 especies, pero no tan significativas para una lista grande de (por ejemplo) 100 especies . La medida de similitud de Sorensen en este caso será igual a alrededor del 20%. [1] [2]
En general, las medidas de similitud asimétrica se pueden representar de la siguiente manera: ; . Y se puede calcular una medida específica de inclusión a partir de la fórmula general para el continuo de las medidas de similitud de Semkin .

Medidas de inclusión para conjuntos finitos

Medidas similares, denominadas coeficientes de "completitud" y "exactitud", se utilizan ampliamente en los sistemas de recuperación de información [3] [4] . Bajo el nombre de " coeficientes de no especificidad " de una flora en relación con otra, B. A. Yurtsev [5] [6] se utiliza en floristería . Después de los trabajos de B. I. Semkin y T. A. Komarova [7] [8] , las medidas de inclusión comenzaron a ser ampliamente utilizadas en sinecología y biogeografía [9] .
Las medidas más utilizadas son:

Medidas de inclusión para conjuntos descriptivos

Para el caso de conjuntos descriptivos (interpretación descriptiva), en ecología son muestras por abundancia, las medidas fueron introducidas por B. I. Semkin y T. A. Komarova. Por ejemplo:

Medidas de inclusión para probabilidades

Si se compara la ocurrencia de especies (interpretación probabilística), es decir, se tienen en cuenta las probabilidades de encontrar objetos, entonces el análogo de las medidas anteriores serán las medidas asimétricas de Dice (medidas de inclusión de eventos) (índice de asociación), propuesta por L. R. Dice en 1945 [10] :

Las medidas de dados, como todas las medidas de inclusión de eventos, son medidas de probabilidad y son esencialmente probabilidades condicionales .

Medidas de inclusión para la interpretación de la información

Para la interpretación analítica informativa, se utilizan medidas relativas de dependencia unidireccional . [11] [12]

Véase también

Literatura

  1. Semkin B. I. Sobre la relación entre los valores medios de dos medidas de inclusión y medidas de similitud  (enlace inaccesible) // Bol. BSI FEB RAS: científico. revista / Nerd. Jardín-Instituto FEB RAS. - Vladivostok, 2009. Edición. 3. Art. 91-101.
  2. Semkin B. I., Oreshko A. P., Gorshkov M. V. Sobre el uso de tecnologías bioinformáticas en floristería comparativa. II. Medidas de inclusión para conjuntos descriptivos y su uso  (enlace inaccesible) // Bol. BSI FEB RAS: científico. revista / BSI FEB RAN. - Vladivostok, 2009. Edición. 4. S. 58-70.
  3. Clevardon CW La prueba de dispositivos de lenguaje indexados // Actas de Aslib. 1963. V. 15. No. 4. P. 106-130.
  4. Salton G. A. Procesamiento automático, almacenamiento y búsqueda de información. — M.: Sov. Radio, 1973. - 560 págs.
  5. Yurtsev B. A. Flora Suntar-Khayat. - L.: Nauka, 1968. - 235 p.
  6. Semkin B. I. Indicadores cuantitativos para evaluar las relaciones florísticas unilaterales propuestas por B. A. Yurtsev // Bot. y. 2007. V. 92. Nº 4. S. 114-127.
  7. Semkin B. I., Komarova T. A. Análisis de descripciones fitocenóticas usando medidas de inclusión (sobre el ejemplo de comunidades de plantas del valle del río Amguema en Chukotka) // Bot. y. 1977. V. 62. Nº 1. S. 54-63.
  8. Semkin B.I., Komarova T.A. El uso de medidas de inclusión en el estudio de sucesiones secundarias (sobre el ejemplo de las comunidades posteriores al incendio de Sikhote-Alin) // Bot. y. 1985. V. 70. Nº 1. S. 89-97.
  9. Andreev V. L. Construcciones de clasificación en ecología y sistemática. — M.: Nauka, 1980. — 142 p.
  10. Dice LR Medidas de la cantidad de asociación ecológica entre especies // Ecología. 1945. V. 26. No. 3. P. 297-302.
  11. Nakahama H., Nishioka S. Dependencia estadística entre intervalos en secuencias de impulsos neuronales // J. Theoret. Biol. 1966. V. 12. No. 1. P. 140-146.
  12. Nakahama H., Nishioka S., Otsuka T., Aikawa S. Dependencia estadística entre intervalos entre picos de actividad espontánea en neuronas del lemniscal talámico // J. Neurophysiol. 1966. V. 29. Nº 5. P. 921-934.