Cómo mentir con las estadísticas

Cómo mentir con las estadísticas
Autor Darell Huff
Idioma original inglés
Original publicado 1954
Decoración irving geis
Editor WW Norton & Company Inc.
Paginas 142
ISBN 0-393-31072-8

Cómo mentir con las estadísticas  es un libro escrito por Darell Huff .en 1954. Ella habla sobre las diversas formas en que las estadísticas pueden usarse indebidamente para engañar a la audiencia y manipular sus opiniones. Se consideran muchos ejemplos específicos, principalmente de la vida estadounidense (publicidad, política, propaganda y agitación).

El primer epígrafe del libro es una cita del Conde Beaconsfield (B. Disraeli) sobre estadísticas: "Hay tres tipos de mentiras: mentiras, mentiras flagrantes y estadísticas".

El libro está dirigido al lector no especialista y está provisto de ilustraciones vívidas. El material se presenta de forma vívida y accesible, lo que aseguró la gran popularidad del libro: es una de las publicaciones sobre estadística de mayor circulación en la segunda mitad del siglo XX [1] .

Contenidos

La muestra está inherentemente sesgada

Una explicación de qué es el muestreo , cómo los entrevistadores seleccionan inconscientemente a los entrevistados e influyen en sus respuestas.

Un promedio bien elegido

Se consideran los tipos de promedio:

Los ejemplos muestran cómo la elección del tipo de valor medio afecta su valor para las mismas muestras. Se llama la atención sobre la posibilidad de manipular a un lector no preparado eligiendo un tipo de promedio "conveniente" (para el manipulador).

Matices modestamente silenciosos

En este capítulo, el autor considera matices importantes de la investigación estadística que a menudo se omiten de manera intencional o inconsciente en los artículos destinados al público en general.

Se explica la importancia del tamaño de la muestra y su relación con el tipo de población. Se dan ejemplos de manipulaciones del tamaño de la muestra:

Se introducen conceptos:

Sobre el ejemplo de la escala de desarrollo de Hesselhabla sobre el peligro de percibir una evaluación puntual (fuera de intervalo) del valor promedio: los padres comienzan a entrar en pánico si su hijo no cumple con la norma (valor promedio).

Se llama la atención sobre la importancia de la redacción en artículos basados ​​en estadísticas. Como ejemplo, considere la declaración de las compañías de suministro de electricidad (1948): "La energía eléctrica está disponible para más de 3/4 de las granjas en los Estados Unidos". La palabra "accesible", que no se define de ninguna manera en la solicitud, no tiene sentido; por lo general, significa que la línea eléctrica está ubicada a una distancia de 10 a 100 millas (16 a 160 km) de la granja, pero algo otra cosa puede entenderse como accesibilidad. El autor también señala que al interpretar los mismos datos, se podría poner el énfasis opuesto, escribiendo: "La energía eléctrica no está disponible para una cuarta parte de las granjas estadounidenses".

El capítulo termina con un recordatorio de la importancia de tener números en los gráficos: un gráfico del crecimiento de las ganancias de una empresa durante varios años (publicado en la revista Fortune) no le dice nada al lector porque el eje y no tiene etiquetas numéricas. A partir de ese gráfico, es imposible saber si el crecimiento de las ganancias fue significativo, promedio o cercano a cero.

Mucho ruido y pocas nueces

Los conceptos de intervalo de confianza y nivel de confianza se ilustran con ejemplos de la vida real:

El horario es tan bueno como parece

El primero de los capítulos dedicado a la consideración de formas de manipular con la ayuda de información gráfica.

Considera formas de distorsionar la percepción de los gráficos:

Imagen esquemática

Comprender formas de engañar a la audiencia con la ayuda de infografías .

El uso de objetos gráficos asociados con la información que se presenta abre amplias oportunidades para el abuso. Esta afirmación se ilustra con una serie de ejemplos:

La siguiente figura muestra un ejemplo de abuso infográfico: el segundo objeto es visualmente 8 veces más grande:

Figura pseudo-justificada

El capítulo comienza con una recomendación mordaz: "Si no puede probar lo que quiere, entonces demuestre otra cosa y finja que estas cosas son iguales".

Hay muchos ejemplos de este tipo de estafas. En particular:

De nuevo, “después se debe a”

Este capítulo habla sobre el concepto de correlación y la confusión que suele surgir entre causa y efecto. Si los fenómenos A y B ocurren juntos, esto se puede explicar de tres maneras:

  1. El fenómeno A es una consecuencia del fenómeno B.
  2. El fenómeno B es una consecuencia del fenómeno A
  3. Los fenómenos A y B son consecuencias de otro/otros fenómenos

Se dan varios ejemplos de juicios erróneos sobre las relaciones causales. En particular:

El capítulo termina con un ejemplo casi anecdótico (pero real) de la confusión de causa y efecto por parte de los nativos de las Nuevas Hébridas. Creían que la presencia de piojos conduce a la salud. Se llegó a esta conclusión sobre la base de que los piojos abandonaron a la persona enferma (porque, debido al aumento de la temperatura corporal, las condiciones de vida para ellos se volvieron incómodas), mientras que todas las personas sanas los tenían (en otras palabras, hubo una correlación positiva entre la salud y la presencia de piojos).

Cómo producir estadísticas

Las estadísticas son manipulaciones estadísticas. En este capítulo, el autor muestra una vez más cómo manipular datos estadísticos usando ejemplos específicos. Sin embargo, insta a no rechazar indiscriminadamente los datos estadísticos, sino a estudiarlos concienzudamente, a fondo, con cautelosa incredulidad, antes de tomar nota.

Cómo poner las estadísticas en su lugar

El autor propone comprobar los datos estadísticos con la ayuda de cinco sencillas preguntas:

Ediciones en otros idiomas

En ruso

Notas

  1. "Durante los últimos cincuenta años, How to Lie with Statistics ha vendido más copias que cualquier otro texto estadístico". JM Steele. Darrell Huff and Fifty Years of How to Lie with Statistics Archivado el 23 de febrero de 2021 en Wayback Machine . Statistical Science , 20(3), 2005, 205-209.

Enlaces