La regla de Sturges es una regla empírica para determinar el número óptimo de intervalos en los que se divide el rango de variación observado de una variable aleatoria al construir un histograma de su densidad de distribución. Nombrado en honor al estadístico estadounidense Herbert Sturges ( 1882-1958 ).
El número de intervalos se define como:
,donde es el número total de observaciones de la cantidad, es el logaritmo en base 2 y es la parte entera de .
A menudo se encuentra escrito en términos del logaritmo decimal:
,La base para esto es una estimación del número de eventos con diferentes probabilidades en el esquema de prueba de Bernoulli con una duración de una etapa. Si hay series de prueba con 2 resultados alternativos con una probabilidad constante de cada uno, entonces el número de tipos de serie, donde la composición contiene resultados que toman el primero de los valores alternativos y, en consecuencia, toman el segundo, es igual a: (de a ), y el número total de series .
Si aproximamos los valores de la variable aleatoria observada por los resultados de sumar los valores de dos números que caen aleatoriamente en una serie de pruebas y (por ejemplo , y ) correspondientes a los resultados del esquema de Bernoulli, entonces cada serie de pruebas que contenga resultados con un resultado y resultados con un resultado corresponderá a la suma . El número de valores diferentes (en el caso considerado: , para el par - ) será igual al número de secuencias con diferente número de resultados . Por lo tanto, si configuramos la tarea de modo que para cada intervalo entre y haya en promedio al menos un valor de la suma y, por lo tanto, al menos una serie de pruebas que simulen la recepción de una variable aleatoria, entonces el número de etapas en la serie es igual al número de intervalos para los cuales se descompone el rango de valores observados, no debe ser más de
La distribución de las magnitudes resultantes ( distribución de Bernoulli ) se aproxima en general a una distribución normal según el teorema de Moivre-Laplace , lo que da razón, bajo el supuesto de que la distribución de la magnitud estudiada es próxima a la normal y, en consecuencia, a la binomial aproximado por ella, para aplicar una estimación del número de intervalos de partición según el número de valores discretos esperados para la distribución de Bernoulli, lo que conduce a la regla de Sturges.