Histograma (estadísticas)

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 27 de abril de 2016; las comprobaciones requieren 10 ediciones .

Un histograma en estadística matemática  es uno de los métodos gráficos para estudiar la distribución de series de valores de una variable aleatoria. [B:1]

Entre los métodos gráficos para el estudio de las series de distribución, se indican los siguientes [1] :

Los polígonos de paso y los polígonos de frecuencia se denominan colectivamente polígonos de distribución . El gráfico de dispersión, el polígono escalonado y el polígono de frecuencia se indican como los más convenientes. [una]

Para el caso bidimensional, en lugar de una serie de distribución, se construye una tabla de distribución y la construcción gráfica correspondiente se denomina prismograma . [una]

Definición

Según GOST

GOST R 50779.10-2000 ofreció las siguientes definiciones:

2.17 histograma
Representación gráfica de la distribución de frecuencias de una característica cuantitativa, formada por rectángulos contiguos cuyas bases son intervalos de clase y cuyas áreas son proporcionales a las frecuencias de estas clases

2.18 gráfico de barras
Representación gráfica de la distribución de frecuencias de una variable aleatoria discreta, formado por un conjunto de columnas de igual ancho, cuyas alturas son proporcionales a las frecuencias[D:1]

Definición alternativa

Sea una muestra de alguna distribución . Definamos una partición de la recta real . Dejar

es el número de elementos de la muestra que caen en el intervalo th. Entonces una función constante por partes , que tiene la forma:

, se llama histograma normalizado.[2]

Histograma de una distribución perfectamente continua

Sea la distribución de variables aleatorias absolutamente continua y esté dada por la densidad de probabilidad . Después

en probabilidad en . [3]

Procedimiento para construir un histograma

Cuando se dibuja según el método de los rectángulos, el eje horizontal se divide en segmentos iguales correspondientes a los rangos ; sobre estos segmentos, como sobre las bases, se construyen rectángulos con una altura proporcional a la frecuencia de una descarga dada. [cuatro]

Describamos este procedimiento con más detalle. Primero, el conjunto de valores que puede tomar el elemento de muestra se divide en varios bits (bins). La mayoría de las veces, estos intervalos se toman de la misma manera, pero este no es un requisito estricto. Estos intervalos se trazan en el eje horizontal, luego se dibuja un rectángulo encima de cada uno. Si todos los intervalos fueran iguales, entonces la altura de cada rectángulo es proporcional al número de elementos de muestra que caen en el intervalo correspondiente. Si los intervalos son diferentes, la altura del rectángulo se elige de modo que su área sea proporcional al número de elementos de la muestra que caen en este intervalo.

Es fundamental para la construcción de un histograma elegir la partición óptima, ya que a medida que aumentan los intervalos, disminuye el detalle de la estimación de la densidad de distribución, y a medida que disminuyen los intervalos, disminuye la precisión de su valor. Para seleccionar el número óptimo de intervalos , a menudo se utiliza la regla de Sturges .

,

donde es el número total de observaciones de la cantidad, es el logaritmo en base 2 y es la parte entera de .

También se encuentra a menudo una regla que estima el número óptimo de intervalos como la raíz cuadrada del número total de mediciones:

Uso

La representación de la serie de distribución en forma transformada es una condición necesaria cuando se comparan estas series entre sí [1] .

El estudio de las series de distribución se facilita mucho con el uso del método gráfico . Al representar series de distribución, los valores de las descargas o los valores observados de la variable aleatoria se representan en el eje horizontal y en el eje vertical, respectivamente, las frecuencias de bits o las frecuencias observadas [1] .

La construcción de histogramas se utiliza para obtener una estimación empírica de la densidad de distribución de una variable aleatoria [5] .

En la forma más general, una de las tareas más importantes se formula de la siguiente manera: en un nivel de significación dado, probar la hipótesis de que la distribución presentada en el histograma es monomodal [A: 1] .

Ejemplos de uso

El análisis de histogramas se considera tradicionalmente entre los geólogos como un método claro e informativo para resolver problemas geológicos, ya que el análisis de histogramas permite probar hipótesis geológicas formuladas en el lenguaje de la estadística [A: 1] .

En cardiología, la construcción y descripción de un histograma es un método geométrico obligatorio para el análisis de la variabilidad de la frecuencia cardíaca , propuesto por los estándares de 1996 [A: 2] [B: 2] . Como formas adicionales de describir los histogramas de frecuencia cardíaca, se utilizan métodos de su interpretación triangular , como el índice de St. George y el índice triangular [6] .

En producción, al analizar el estado del proceso tecnológico, la construcción de histogramas se considera una forma efectiva de evaluar la situación y realizar un análisis en la primera etapa del estudio de la estabilidad del proceso tecnológico, y también se considera como uno de los herramientas efectivas de gestión de calidad en la etapa de control de calidad del producto terminado y análisis del estado actual del proceso tecnológico [A :3] .

Véase también

Notas

  1. 1 2 3 4 5 Mitropolsky, 1971 , § 2 Filas y tablas de distribución, p. 20-43.
  2. Un histograma normalizado es una densidad de probabilidad. En particular:
    • .
    • .
  3. Así, el área de la figura bajo el histograma normalizado, limitada por el intervalo , se aproxima a la probabilidad de aceptar valores dentro de este intervalo de alguna de las variables aleatorias . Sin embargo, el histograma normalizado no converge puntualmente a la densidad de distribución teórica de estas variables aleatorias.
  4. Mitropolski, 1971 , pág. 32.
  5. Para construir un histograma, el rango de variación observado de una variable aleatoria se divide en varios intervalos y se calcula la proporción de todas las medidas que caen en cada uno de los intervalos. El valor de cada acción se toma como una estimación de la probabilidad de que una variable aleatoria caiga en el intervalo correspondiente. Es erróneo hablar de densidad de probabilidad en el contexto de un histograma, ya que la histograma transforma una distribución de cualquier tipo en una discreta (se considera el evento de que un valor caiga en un cierto intervalo, cuyo número es contable), y para una variable aleatoria discreta no hay función de densidad de probabilidad.
  6. Ryabykina, 1998 , § 3.6. Métodos geométricos de análisis de ritmogramas, pág. 43-49.

Literatura

Libros

  1. Mitropolsky A. K. . Técnica de cálculos estadísticos. - 2ª ed., revisada. y adicional .. - M . : Nauka, 1971. - 576 p. - (Biblioteca físico-matemática de un ingeniero). - 19 500 copias.
  2. Ryabykina G.V. , Sobolev A.V. Variabilidad de la frecuencia cardíaca. - M. : "Star'Ko", 1998. - 200 p. — ISBN 5-85493-032-3 .

Artículos

  1. 1 2 Tkachev Yu. A. Estudio de histogramas de características geológicas mediante modelado por computadora  // Boletín del Instituto de Geología del Centro Científico Komi de la Rama Ural de la Academia Rusa de Ciencias: revista. - 2004. - Nº 2 . - S. 7-11 .
  2. Grupo de Trabajo de la Sociedad Europea de Cardiología y la Sociedad Norteamericana de Estimulación y Electrofisiología. Variabilidad del ritmo cardíaco. Estándares de medición, interpretación fisiológica y uso clínico Boletín de Arritmología  : Revista  . - 1999. - Nº 11 . - S. 53-78 .
  3. Abdullin I. A. , Beloborodova O. I. , Laptev N. I. , Moskvicheva E. L. , Goryainov A. D. Aplicación de métodos estadísticos para evaluar el proceso tecnológico de producción de cargas con forma  // Boletín de la Universidad Tecnológica de Kazan: revista. - 2010. - Nº 12 . - S. 477-482 .

Documentos normativos

  1. GOST R 50779.10-2000 (ISO 3534-1-93) Métodos estadísticos. Probabilidad y bases de la estadística. Términos y definiciones . docs.cntd.ru. Consultado el 27 de mayo de 2020. Archivado desde el original el 19 de mayo de 2020.

Enlaces

  • Creador de gráficos de barras en línea de Canva
  • Herramienta de gráficos en línea para el servicio web ChartBlocks