La distribución de frecuencias es un método de descripción estadística de datos (valores medidos, valores característicos). Matemáticamente , la distribución de frecuencias es una función que en primer lugar determina el valor ideal para cada indicador, ya que este valor suele estar ya medido. Tal distribución se puede presentar en forma de tabla o gráfico modelando ecuaciones funcionales. En estadística descriptiva , la distribución de frecuencia tiene una serie de funciones matemáticas que se utilizan para aplanar y analizar la distribución de frecuencia (como la distribución normal de Gauss ).
El volumen de datos (valores medidos, datos de encuestas) es la primera lista desordenada original. Primero, necesita ser ordenado. De la lista original, en este caso, puede haber una ligera desviación de los cuantiles (dispersión estadística), desviación probable y desviación estándar ( regla general : desviación estándar = distancia / 6).
Luego asignamos un valor a cada valor y los sumamos. Como regla, obtenemos la frecuencia absoluta. Con base en los datos de frecuencia absoluta, calculamos el número total de valores de muestra y calculamos las frecuencias relativas. Ahora tenemos un conjunto ordenado de pares de valores (valores característicos y sus frecuencias relativas asociadas), el llamado rating.
Agreguemos las frecuencias relativas, comenzando con el valor de característica más pequeño, y asigne a cada característica el valor de la suma (incluida su propia contribución), de modo que obtengamos la distribución . Esto indica para cada valor característico qué tan grande es su proporción menor o igual que el valor característico correspondiente. El porcentaje comienza en 0 y sube hasta 1 o 100. Gráficamente, esto se representa mediante una curva débil que aumenta monótonamente , que tiene una forma de S alargada. Existen numerosos intentos de reproducir los resultados de distribución mediante ecuaciones funcionales . La distribución de suma, dependiendo de los valores de las características, es el tipo más simple de representación de la distribución de frecuencia.
De acuerdo con las reglas, también es necesario clasificar los valores característicos. Este procedimiento divide el rango de valores que ocurren, por ejemplo, en 10 o 20 clases de igual ancho (valores dispersos en los bordes (ver " outliers ") a veces agrupados en clases más grandes). Luego se determina la densidad de la función , la derivada de la función de distribución, de acuerdo con la característica del valor en el caso de una distribución continua. Además, la frecuencia se puede determinar no solo contando, sino también, por ejemplo, pesando. Entonces obtenemos una distribución masiva en lugar de una serie de distribución. En principio, se puede utilizar cualquier cantidad aditiva para medir la frecuencia. Si una muestra aleatoria es muy diferente de una distribución normal (curva de campana), los datos pueden estar sesgados al seleccionar efectos o tendencias. Varias pruebas estadísticas ofrecen inferencia o análisis de varianza . Si el tamaño de la muestra está en la superposición de varios subconjuntos (distribución por edades, profesiones, grupos), entonces la distribución de frecuencias en lugar de las máximas también puede ser bivariada o multivariada.