Una escala (escala de medir) es un sistema de signos para el que se establece una visualización ( operación de medición ), que asocia uno u otro elemento (valor) de la escala con objetos, situaciones, eventos o procesos reales . Formalmente, una escala es una tupla , ⟨ X , φ, Y ⟩, donde X es un conjunto de objetos, situaciones, eventos o procesos reales, φ es un mapeo, Y es un conjunto de elementos (valores) de un sistema de signos [ 1] [2] .
Varios tipos de escalas de medición se utilizan ampliamente en la actividad humana teórica y práctica , en la ciencia y la tecnología , incluso en muchos campos científicos humanitarios, como la economía , la psicometría , la sociología y otros [3] [4] para la representación simbólica ( formal ) de objetos (eventos), sus propiedades (características) y relaciones.
Las escalas de medida se clasifican según los tipos de datos que se miden, que determinan las relaciones permitidas para una determinada escala, incluidas las que corresponden a transformaciones matemáticas de los valores de escala [2] [5] . La clasificación de la escala moderna fue propuesta en 1946 por Stanley Smith Stevens .
Escala de nombres (nominal, clasificación) Se utiliza para medir los valores de características cualitativas. El valor de tal característica es el nombre de la clase de equivalencia a la que pertenece el objeto en consideración. Ejemplos de los valores de las características cualitativas son los nombres de estados, colores, marcas de automóviles, etc. Tales características satisfacen los axiomas de identidad:De las escalas consideradas, las dos primeras son no métricas , y el resto son métricas .
El problema de la adecuación de los métodos para el procesamiento matemático de los resultados de las mediciones está directamente relacionado con la cuestión del tipo de escala. En el caso general, las estadísticas adecuadas son aquellas que son invariantes con respecto a las transformaciones admisibles de la escala de medida utilizada.
Tipos de escamas y sus propiedades según la clasificación de Stanley Smith StevensEscala nominal |
escala ordinal |
Escala de intervalo |
Escala de relación | ||
---|---|---|---|---|---|
Operaciones
lógicas/ matemáticas |
× ÷ |
No | No | No | Sí |
+ − |
No | No | Sí | Sí | |
< > |
No | Sí | Sí | Sí | |
= ≠ |
Sí | Sí | Sí | Sí | |
Ejemplos ( variables dicotómicas y no dicotómicas ) |
Dicotómico: género (masculino/femenino) No dicotómica: |
Dicotómico: estado de salud (saludable/enfermo), belleza (hermosa/fea) No dicotómica: |
Fecha (desde 1457 a. C. hasta 2013 d. C.), latitud temperatura |
Edad (de 0 a 99 años) | |
Medida de tendencia central | Moda | Mediana | Promedio | significado geometrico | |
Métrico o no | No métrico (calidad) |
No métrico (calidad) |
Métrica (cuantitativa) |
Métrica (cuantitativa) |
Al analizar varios tipos de escalas, F. N. Ilyasov llega a la conclusión de que las escalas nominales y de intervalo son artefactos de investigación [7][ aclarar ] .
Aunque la tipología de Stevens todavía es ampliamente aplicable, todavía es objeto de críticas por parte de los teóricos, en particular en el caso de la escala nominal y ordinal. [ocho]
Los principales puntos de crítica de las escalas de Stevenson:
Caballero[ ¿Qué? ] criticó los argumentos de Stevens mostrando que la elección de pruebas estadísticas válidas para un conjunto dado de datos no depende de problemas de representación o unicidad, sino de significado. [9]
Baker, Hardik y Petrinovich, así como Borgatta y Bornstedt, han enfatizado que seguir las restricciones de Stevens a menudo obliga a los investigadores a recurrir a la ordenación por rangos de los datos y, por lo tanto, a abandonar el uso de pruebas paramétricas. Su argumento fue más de naturaleza ad hoc y terminó con una propuesta para usar procedimientos paramétricos estándar en lugar de involucrarse con el problema de la robustez. [10] [11]
Guttmann argumentó de manera más general que la interpretación estadística de los datos depende de qué pregunta se hace sobre los datos y qué evidencia estamos dispuestos a aceptar en respuesta a esa pregunta. Definió esta prueba en términos de la función de pérdida elegida para probar la calidad del modelo. [12]
John Tukey también criticó las limitaciones de Stevens como peligrosas para un buen análisis estadístico. Al igual que Lord y Guttman, Tukey destacó la importancia del significado de los datos para determinar tanto la escala como el modo de análisis apropiado. Dado que los tipos de escala de Stevens son absolutos, en una situación en la que, por ejemplo, los datos no pueden considerarse completamente de intervalo, deben degradarse a ordinales.
Incluso el propio Stevens hizo una reserva al señalar: “De hecho, la mayoría de las escalas que los psicólogos utilizan de manera amplia y efectiva son escalas de orden. Las estadísticas ordinarias, incluidas las medias y las desviaciones estándar, no deben usarse estrictamente cuando se trabaja con estas escalas, pero se puede dar una cierta justificación pragmática a tal uso no autorizado: en muchos casos conduce a resultados fructíferos.
Duncan[ ¿Qué? ] (1986) objetó el uso de la palabra "medida" en la descripción de la escala nominal, pero Stevens (1975) luego dio su propia definición de "medida", que suena como "atribuir una característica de acuerdo con alguna regla". La única regla que no puede utilizarse para estos fines es la atribución accidental. Sin embargo, la llamada "dimensión nominal" incluye el juicio de valor del investigador, y las posibles transformaciones de esta dimensión son infinitas. Esta es una de las observaciones que hizo Lord en 1953 en el artículo satírico Sobre el tratamiento estadístico de los números de fútbol [13]
El uso de "media" como medida de tendencia central para el tipo ordinal sigue siendo controvertido entre quienes aceptan la tipología de Stevens. A pesar de esto, muchos científicos del comportamiento usan la media para datos ordinales. La justificación habitual para esto es que el tipo ordinal en las ciencias del comportamiento se encuentra en algún lugar entre los verdaderos tipos ordinal y de intervalo. Aunque la diferencia de espacio entre dos dígitos ordinales no es constante, a menudo es del mismo orden.
Por ejemplo, la aplicación de modelos de medición en un contexto educativo muestra que las calificaciones generales tienen una relación bastante lineal con las mediciones dentro del rango de calificaciones. Por lo tanto, algunos argumentan que siempre que la diferencia en el espacio entre los dígitos ordinales no sea muy grande, las estadísticas de las escalas de intervalo (p. ej., "media") pueden tener un resultado significativo para las escalas ordinales. El software de análisis estadístico (por ejemplo, SPSS ) requiere que el usuario especifique la clase de medida apropiada para cada variable. Esto asegura que los errores no intencionales del usuario no conduzcan a un análisis sin sentido (ejemplo: análisis de correlación con una variable nominal).
Thurstone[ ¿Qué? ] avanzó en el desarrollo de una justificación para derivar un tipo de intervalo basado en la ley del juicio comparativo . Una aplicación común de la ley es el proceso analítico de jerarquía . Geogr Rasch ha avanzado aún más al desarrollar el modelo probabilístico de Rasch , que proporciona la base teórica y la justificación para derivar mediciones de intervalos a partir de conteos de observación (p. ej., puntajes totales para calificaciones).
A pesar de todas las críticas, en una amplia gama de situaciones, la experiencia muestra que la aplicación de estadísticas prohibidas a los datos conduce a resultados científicamente significativos que son importantes en la toma de decisiones y valiosos para futuras investigaciones.
Hay otras tipologías además de Stevens. Por ejemplo: Mostller Mosteller y Tukey (1977), Nelder (1990) crearon descripciones de conteo continuo, relaciones continuas y modelos de datos categóricos. Véase también: Chrisman (1998), van den Berg (1991).
Tipología de Mosteller y Tukey (1977)mostellery Tukey notó que el nivel 4 no era suficiente y propuso la siguiente división: [14]
Por ejemplo, los porcentajes (una variante de las fracciones en términos de Mosteller-Tukey) no se ajustan a la teoría de Stevens, ya que no existen transformaciones completamente válidas. [ocho]
Tipología de Crisman (1998)Nicholas Crisman ha propuesto una búsqueda de nivel de dimensión ampliada para dar cuenta de diferentes dimensiones que no se corresponden necesariamente con las nociones tradicionales de niveles de dimensión. Las medidas relacionadas con el rango y la repetición (por ejemplo, grados radiales en un círculo, horas, etc.), categorías de membresía graduada y otros tipos de medidas no coinciden con el trabajo original de Steven, lo que resultó en la introducción de seis nuevos niveles de medida a los diez existentes. :
Los niveles de medición extendidos rara vez se usan fuera de la geografía académica. [quince]
La teoría del tipo de escala es una especie de "sirviente intelectual" de la teoría operativa de la medición de Stevens, que se ha convertido en definitiva en psicología y ciencias del comportamiento , a pesar de las críticas de Michell por ser inconsistente con las mediciones en las ciencias naturales (Michell, 1999). De hecho, la Teoría de la Medición Operacional fue una reacción a los hallazgos de un comité establecido por la Asociación Británica para el Avance de la Ciencia en 1932 para explorar la posibilidad de una medición científica genuina en las ciencias psicológicas y del comportamiento. Este comité, que se conoció como el "Comité Ferguson", publicó un informe final (Ferguson, et al., 1940, p. 245) en el que la escala de sueño de Stevens (Stevens & Davis, 1938) fue objeto de críticas.
…cualquier ley que pretenda expresar una relación cuantitativa entre la intensidad de una sensación y la intensidad de un estímulo no sólo es falsa, sino que en realidad no tiene sentido hasta que la noción de adición aplicada a la sensación adquiere sentido.
Entonces, si la escala de sueños de Stevens mide la intensidad de las sensaciones de una audiencia, se debe producir evidencia de que estas sensaciones son atributos cuantitativos. La evidencia necesaria fue la presencia de "estructuras aditivas" - un concepto desarrollado por el matemático alemán Otto Holder (Hölder, 1901). Con el físico y teórico de la medición Norman Robert Campbell dominando la discusión del comité de Ferguson, se dictaminó que las mediciones en las ciencias sociales eran imposibles debido a la ausencia de la operación de concatenación . Posteriormente, esta decisión fue reconocida como incorrecta después del desarrollo de la teoría de las medidas conjuntas por Debru, así como de forma independiente por Luce y Tukey. Sin embargo, Stevens no quería introducir experimentos adicionales para detectar estructuras aditivas, sino invalidar por completo la decisión del comité de Ferguson al proponer una nueva teoría de medición.
Parafraseando a N. R. Campbell (Final Report, p.340), se puede decir que la medida, en el sentido más amplio, se define como la asignación de números a objetos y eventos de acuerdo con alguna regla (Stevens, 1946, p.677).
Stevens estuvo muy influenciado por las ideas de otro académico de Harvard ganador del Premio Nobel , el físico Percy Bridgman (1927), cuya doctrina del "Operacionismo" Stevens usó para definir el término "medida". Por ejemplo, la definición de Stevens utiliza una cinta métrica que define la longitud (objeto de medida) como medible (por lo tanto, cuantificable). Los críticos del operacionalismo responden que confunde las relaciones entre dos objetos o eventos con las propiedades de uno de los objetos o eventos (Hardcastle, 1995; Michell, 1999; Moyer, 1981a, b; Rogers, 1989).
El teórico de la medición canadiense William Rozeboom (1966) fue uno de los primeros críticos en pronunciarse enérgicamente contra la teoría de los tipos de escala de Stevens.
El tipo de variable depende del contextoOtro problema puede ser que una misma variable pueda tener diferentes tipos de escalas dependiendo de cómo se mida y el propósito del análisis. Por ejemplo, el color del cabello suele considerarse una variable nominal porque no tiene un orden específico. [16] Sin embargo, es posible organizar los colores en un cierto orden de varias maneras, incluso por tono, usando colorimetría .
Usando varias escalas, es posible producir varias medidas psicológicas [17] . Los primeros métodos de mediciones psicológicas se desarrollaron en psicofísica . La tarea principal de los psicofísicos era cómo determinar cómo los parámetros físicos de estimulación se correlacionan con las evaluaciones subjetivas de las sensaciones que les corresponden. Conociendo esta conexión, uno puede entender qué sensación corresponde a uno u otro signo. La función psicofísica establece una relación entre el valor numérico de la escala de medida física del estímulo y el valor numérico de la respuesta psicológica o subjetiva a este estímulo.