Muestreo con desviación

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 24 de junio de 2017; la verificación requiere 1 edición .

El muestreo de valores atípicos es una técnica utilizada para muestrear distribuciones de probabilidad complejas .

Planteamiento del problema

Para el muestreo de distribución de probabilidad , el muestreo de varianza se utiliza cuando la forma dificulta directamente el muestreo.

La generación de muestras por ocurre con una distribución auxiliar más simple que podemos muestrear, y que cumple la siguiente condición:

, donde .

Algoritmo

  1. Tomar una muestra por distribución ;
  2. Elija un número aleatorio uniformemente del intervalo ;
  3. Calcular ;
    • Si , entonces se agrega a las muestras;
    • Si , entonces se rechaza (de ahí el nombre del método).

El algoritmo selecciona puntos uniformemente del área debajo del gráfico , lo que significa que se obtienen muestras .

Ejemplos

Damos un ejemplo geométrico simple. Supongamos que queremos elegir un punto aleatorio dentro de un círculo de radio unitario.

Generemos un punto eligiendo y como números arbitrarios independientes del segmento . Si resulta que , significa que el punto se encuentra dentro del círculo y debe aceptarse. De lo contrario, se rechaza el punto y se genera el siguiente.

Como otro ejemplo, considere el algoritmo Ziggurat , que se basa en un muestreo sesgado. Este algoritmo se utiliza para generar números aleatorios distribuidos de manera no uniforme.

Problemas

Los problemas, por regla general, surgen cuando se resuelven problemas de alta dimensión .

Será muy grande (de dimensión exponencial) y casi todas las muestras serán rechazadas.

Enlaces

Nikolenko S. Curso de aprendizaje probabilístico .