Muestreo (estadísticas matemáticas)

Muestreo es un nombre generalizado en estadística matemática para los métodos de control de la muestra inicial con un objetivo de modelado conocido, que permiten realizar la identificación estructural-paramétrica del mejor modelo estadístico de un proceso aleatorio ergódico estacionario.

Descripción

La novedad científica del método de muestreo radica en que es una técnica eficaz para la vinculación lógica semántica de las propiedades estadísticas de la muestra y la finalidad del modelado. Al mismo tiempo, el muestreo aumenta la dimensión del espacio de criterios y, al mismo tiempo, actúa como un medio para resolver el problema de la optimización de Pareto al separar criterios particulares y clasificarlos (un criterio estructural tiene un rango más alto que uno paramétrico). , por lo que estos criterios no entran en conflicto). N. N. Chubukov da el siguiente ejemplo [1] . Sea el proceso aleatorio representado por una muestra de tamaño : . Hay que resolver tres tareas:

  1. Ejecute un pronóstico a largo plazo condicional para ;
  2. Ejecute un pronóstico condicionalmente a corto plazo para ;
  3. Defina una función para restaurar el valor en cualquier punto dentro de la selección.

Si tomamos el enfoque tradicional para el modelado, centrado en la unicidad de la descripción de las propiedades estadísticas del proceso, el resultado serán tres funciones completamente idénticas. El hecho es que la regla para calcular el criterio de calidad del modelo no tuvo en cuenta los detalles esenciales: el horizonte de pronóstico, la naturaleza de las tendencias estadísticas del proceso aleatorio representado por datos de muestra y la especificidad objetivo de las tareas fue completamente ignorado _

Principio de diversidad

La salida a esta dificultad puede ser el uso del principio de diversidad dentro del muestreo , el cual es conocido y utilizado para resolver problemas de ingeniería aplicando el método de validación cruzada de datos, por ejemplo, análisis bootstrap [2] , el método de contabilidad grupal de argumentos [3] , etc. La manifestación del principio de diversidad en la resolución de problemas estadísticos es que el algoritmo responde a la ignorancia de las propiedades probabilísticas de los datos iniciales con una variedad de estructuras modelo generadas, cada una de las cuales está sujeta a cruce -Comprobación de la optimización según un cierto esquema común para todos los modelos.

Tareas

El muestreo es un método moderno que puede ser útil en la práctica para resolver problemas de estadística matemática, incluidos problemas inversos y mal planteados [4] . El muestreo implementa el principio de diversidad y puede generalizar toda la gama de herramientas de análisis estadístico basadas en la gestión de datos fuente. El muestreo se entiende como un conjunto de técnicas para dividir la muestra inicial en secciones de trabajo y de control de acuerdo con las reglas que corresponden a los objetivos del modelado. En las secciones de trabajo, se calculan los parámetros de los modelos "competidores", en los de control, se evalúa su capacidad para restaurar los valores que no se utilizaron para calcular los parámetros.

El muestreo metódicamente correcto "pasa por alto" el principal obstáculo que está objetivamente presente en los problemas inversos. Su razón radica en la imposibilidad de establecer una relación matemática estricta entre el parámetro de la variable y el valor numérico del criterio de optimalidad del modelo. Al mismo tiempo, el muestreo traslada el algoritmo de identificación estructural-paramétrica del modelo de la categoría de estrictamente matemático a la clase de heurística, y lo hace prometedor para la creación de sistemas de inteligencia artificial .

En relación con el ejemplo anterior, el primer caso  - extrapolación "larga" fuera de la muestra, corresponde a la variante de muestreo con la exclusión de los últimos diez valores de muestra seguidos del cálculo de los parámetros del modelo. La décima cuenta será el control. La submuestra de trabajo comprenderá todos los valores excepto esta decena. Luego, por enumeración alternativa, se determina el mejor modelo, que predijo con mayor precisión el punto de control. Al cambiar la posición de las muestras excluidas, sin violar su número y continuidad, se forman estadísticas residuales que son aplicables para calcular el criterio y el "tubo" de estabilidad estadística para evaluar la confiabilidad del resultado. El algoritmo, por así decirlo, "examina" los modelos por extrapolación a una profundidad determinada y selecciona de ellos el que captura con mayor precisión las tendencias "largas" que contienen información sobre los valores en un retraso de diez muestras. En este caso, se discriminará a los modelos de "tiro corto".

La segunda tarea corresponderá al muestreo con exclusión de los cálculos de un punto de control, con una combinación del número y orden de los valores anteriores tomados en cuenta para el pronóstico. En este caso, los modelos de "tendencia larga" serán "suprimidos" y, por el contrario, se dará preferencia a los modelos que brindan pronósticos precisos a corto plazo.

En la tercera tarea , se justificará la división de la muestra en bloques interpenetrantes, cuando los valores de control estén “intercalados” entre los trabajadores. La longitud de tales bloques y la profundidad de su interpenetración deben tener en cuenta los intervalos entre los puntos vecinos del rango, la estabilidad requerida y la precisión de las estimaciones. Así, la tercera tarea puede corresponder a la exclusión de los cálculos de cada tercera muestra y el uso de los datos excluidos para el control con una reasignación cíclica de submuestras de control y de trabajo.

Tipos de muestreo

Véase también

Notas

  1. Chubukov N. N. Algoritmización de calibraciones de sistemas mecatrónicos mediante muestreo // Mechatronika, avtomatizatsiya, upravlenie. 2013. Nº 7.
  2. Efron B. Métodos no tradicionales de análisis estadístico multivariado: Sat. artículos: Per. del inglés / Prólogo de Yu. P. Adler, Yu. A. Koshevnik. - M .: Finanzas y estadísticas, 1988. - 263 p. enfermo.
  3. Ivakhnenko, 1971 .
  4. Tikhonov A.N., Arsenin V.Ya. Métodos para resolver problemas mal planteados. - M.: Nauka, 1979. - S. 283 p.

Literatura