Un histograma en estadística matemática es uno de los métodos gráficos para estudiar la distribución de series de valores de una variable aleatoria. [B:1]
Entre los métodos gráficos para el estudio de las series de distribución, se indican los siguientes [1] :
Los polígonos de paso y los polígonos de frecuencia se denominan colectivamente polígonos de distribución . El gráfico de dispersión, el polígono escalonado y el polígono de frecuencia se indican como los más convenientes. [una]
Para el caso bidimensional, en lugar de una serie de distribución, se construye una tabla de distribución y la construcción gráfica correspondiente se denomina prismograma . [una]
GOST R 50779.10-2000 ofreció las siguientes definiciones:
2.17 histograma
Representación gráfica de la distribución de frecuencias de una característica cuantitativa, formada por rectángulos contiguos cuyas bases son intervalos de clase y cuyas áreas son proporcionales a las frecuencias de estas clases
2.18 gráfico de barras
Representación gráfica de la distribución de frecuencias de una variable aleatoria discreta, formado por un conjunto de columnas de igual ancho, cuyas alturas son proporcionales a las frecuencias[D:1]
Sea una muestra de alguna distribución . Definamos una partición de la recta real . Dejar
es el número de elementos de la muestra que caen en el intervalo th. Entonces una función constante por partes , que tiene la forma:
, se llama histograma normalizado.[2]Sea la distribución de variables aleatorias absolutamente continua y esté dada por la densidad de probabilidad . Después
en probabilidad en . [3]Cuando se dibuja según el método de los rectángulos, el eje horizontal se divide en segmentos iguales correspondientes a los rangos ; sobre estos segmentos, como sobre las bases, se construyen rectángulos con una altura proporcional a la frecuencia de una descarga dada. [cuatro]
Describamos este procedimiento con más detalle. Primero, el conjunto de valores que puede tomar el elemento de muestra se divide en varios bits (bins). La mayoría de las veces, estos intervalos se toman de la misma manera, pero este no es un requisito estricto. Estos intervalos se trazan en el eje horizontal, luego se dibuja un rectángulo encima de cada uno. Si todos los intervalos fueran iguales, entonces la altura de cada rectángulo es proporcional al número de elementos de muestra que caen en el intervalo correspondiente. Si los intervalos son diferentes, la altura del rectángulo se elige de modo que su área sea proporcional al número de elementos de la muestra que caen en este intervalo.
Es fundamental para la construcción de un histograma elegir la partición óptima, ya que a medida que aumentan los intervalos, disminuye el detalle de la estimación de la densidad de distribución, y a medida que disminuyen los intervalos, disminuye la precisión de su valor. Para seleccionar el número óptimo de intervalos , a menudo se utiliza la regla de Sturges .
,donde es el número total de observaciones de la cantidad, es el logaritmo en base 2 y es la parte entera de .
También se encuentra a menudo una regla que estima el número óptimo de intervalos como la raíz cuadrada del número total de mediciones:
La representación de la serie de distribución en forma transformada es una condición necesaria cuando se comparan estas series entre sí [1] .
El estudio de las series de distribución se facilita mucho con el uso del método gráfico . Al representar series de distribución, los valores de las descargas o los valores observados de la variable aleatoria se representan en el eje horizontal y en el eje vertical, respectivamente, las frecuencias de bits o las frecuencias observadas [1] .
La construcción de histogramas se utiliza para obtener una estimación empírica de la densidad de distribución de una variable aleatoria [5] .
En la forma más general, una de las tareas más importantes se formula de la siguiente manera: en un nivel de significación dado, probar la hipótesis de que la distribución presentada en el histograma es monomodal [A: 1] .
El análisis de histogramas se considera tradicionalmente entre los geólogos como un método claro e informativo para resolver problemas geológicos, ya que el análisis de histogramas permite probar hipótesis geológicas formuladas en el lenguaje de la estadística [A: 1] .
En cardiología, la construcción y descripción de un histograma es un método geométrico obligatorio para el análisis de la variabilidad de la frecuencia cardíaca , propuesto por los estándares de 1996 [A: 2] [B: 2] . Como formas adicionales de describir los histogramas de frecuencia cardíaca, se utilizan métodos de su interpretación triangular , como el índice de St. George y el índice triangular [6] .
En producción, al analizar el estado del proceso tecnológico, la construcción de histogramas se considera una forma efectiva de evaluar la situación y realizar un análisis en la primera etapa del estudio de la estabilidad del proceso tecnológico, y también se considera como uno de los herramientas efectivas de gestión de calidad en la etapa de control de calidad del producto terminado y análisis del estado actual del proceso tecnológico [A :3] .