Métricas del centro de distribución

Las puntuaciones del centro de distribución se utilizan para determinar los promedios de población o los valores más típicos . Los principales son la expectativa matemática , la media aritmética , la media geométrica , la media armónica , la potencia media , las medias ponderadas , el centro de pliegue , la mediana , la moda .

El cálculo de los promedios se realiza de diferentes formas y, en consecuencia, su aplicación también depende de la población objeto de estudio.

Una distribución unimodal univariante simétrica tiene la misma media, mediana y moda.

Esperanza matemática

.

En la literatura extranjera, se utiliza la designación .

En el caso de una cantidad discreta y densidad constante , se aplica la media muestral :

.

Ventajas: si el experimento se repite muchas veces y los resultados se suman (por ejemplo, en seguros , juegos de azar ), la expectativa matemática es una elección natural.

Desventajas: no corresponde a la comprensión intuitiva del "promedio"; una minoría con valores anómalos (centenarios, multimillonarios, productos defectuosos, etc.) desplazan seriamente la expectativa. En los cálculos estadísticos, se recomienda descartar tal "cola" .

mediana

Para una distribución unidimensional, la mediana es el cuantil del nivel 0,5. En otras palabras, la mediana es un número tal que o .

Ventajas: La mediana es consistente con la comprensión intuitiva de "media". Además, incluso los valores atípicos muy "salvajes" cambian la mediana de manera insignificante. Por ejemplo, si cien personas pobres (ingresos distribuidos uniformemente de $0 a $1) se suman a un multimillonario ($1 mil millones), el promedio cambiará de $0,5 a $10 millones, mientras que la mediana cambiará de $0,5 a $0,505. . Una función monótona no cambia la mediana; para cualquier función monótona , .

Desventajas: no funciona bien para distribuciones multivariadas con una relación compleja de componentes. Difícil de calcular.

Moda

La moda es el punto en el que la densidad de distribución tiene un máximo local. Una distribución puede tener múltiples modos.

Beneficios: permite trabajar con datos no numéricos.

Desventaja: No tiene en cuenta el comportamiento de distribución en otros puntos.