Las medidas de inclusión son medidas de similitud asimétrica que reflejan el grado de proximidad de un objeto en relación con otro. No tiene sentido utilizar medidas de inclusión por separado. Las medidas de inclusión también se conocen como medidas asimétricas, medidas de convergencia direccional. Las medidas de inclusión reflejan relaciones todo-parte. También existe el concepto de medidas de no inclusión, que se definen como la suma de medidas de inclusión a 1. Por lo general, las medidas de inclusión se representan como una matriz de inclusión
Cabe destacar especialmente que las medidas de inclusión son más informativas en general, y especialmente para objetos de diferentes tamaños en cuanto al número de características, que las medidas de similitud, ya que estas últimas, de hecho, son indicadores medios y, por tanto, pierden algo de información. sobre los objetos, y las medidas de inclusión asimétrica evalúan adecuadamente las relaciones no transitivas que son más comunes en la naturaleza. Por ejemplo, una lista puede estar incluida al 100 % en otra lista, y la otra lista, a su vez, puede estar incluida solo al 10 %. Al mismo tiempo, el coeficiente de similitud no podrá reflejar adecuadamente estas relaciones, ya que, por ejemplo, 10 especies comunes son significativas para una lista de 10 especies, pero no tan significativas para una lista grande de (por ejemplo) 100 especies . La medida de similitud de Sorensen en este caso será igual a alrededor del 20%. [1] [2]
En general, las medidas de similitud asimétrica se pueden representar de la siguiente manera: ; . Y se puede calcular una medida específica de inclusión a partir de la fórmula general para el continuo de las medidas de similitud de Semkin .
Medidas similares, denominadas coeficientes de "completitud" y "exactitud", se utilizan ampliamente en los sistemas de recuperación de información [3] [4] . Bajo el nombre de " coeficientes de no especificidad " de una flora en relación con otra, B. A. Yurtsev [5] [6] se utiliza en floristería . Después de los trabajos de B. I. Semkin y T. A. Komarova [7] [8] , las medidas de inclusión comenzaron a ser ampliamente utilizadas en sinecología y biogeografía [9] .
Las medidas más utilizadas son:
Para el caso de conjuntos descriptivos (interpretación descriptiva), en ecología son muestras por abundancia, las medidas fueron introducidas por B. I. Semkin y T. A. Komarova. Por ejemplo:
Si se compara la ocurrencia de especies (interpretación probabilística), es decir, se tienen en cuenta las probabilidades de encontrar objetos, entonces el análogo de las medidas anteriores serán las medidas asimétricas de Dice (medidas de inclusión de eventos) (índice de asociación), propuesta por L. R. Dice en 1945 [10] :
Las medidas de dados, como todas las medidas de inclusión de eventos, son medidas de probabilidad y son esencialmente probabilidades condicionales .
Para la interpretación analítica informativa, se utilizan medidas relativas de dependencia unidireccional . [11] [12]