Cómo mentir con las estadísticas
Cómo mentir con las estadísticas |
Autor |
Darell Huff |
Idioma original |
inglés |
Original publicado |
1954 |
Decoración |
irving geis |
Editor |
WW Norton & Company Inc. |
Paginas |
142 |
ISBN |
0-393-31072-8 |
Cómo mentir con las estadísticas es un libro escrito por Darell Huff .en 1954. Ella habla sobre las diversas formas en que las estadísticas pueden usarse indebidamente para engañar a la audiencia y manipular sus opiniones. Se consideran muchos ejemplos específicos, principalmente de la vida estadounidense (publicidad, política, propaganda y agitación).
El primer epígrafe del libro es una cita del Conde Beaconsfield (B. Disraeli) sobre estadísticas: "Hay tres tipos de mentiras: mentiras, mentiras flagrantes y estadísticas".
El libro está dirigido al lector no especialista y está provisto de ilustraciones vívidas. El material se presenta de forma vívida y accesible, lo que aseguró la gran popularidad del libro: es una de las publicaciones sobre estadística de mayor circulación en la segunda mitad del siglo XX [1] .
Contenidos
La muestra está inherentemente sesgada
Una explicación de qué es el muestreo , cómo los entrevistadores seleccionan inconscientemente a los entrevistados e influyen en sus respuestas.
Un promedio bien elegido
Se consideran los tipos de promedio:
Los ejemplos muestran cómo la elección del tipo de valor medio afecta su valor para las mismas muestras. Se llama la atención sobre la posibilidad de manipular a un lector no preparado eligiendo un tipo de promedio "conveniente" (para el manipulador).
Matices modestamente silenciosos
En este capítulo, el autor considera matices importantes de la investigación estadística que a menudo se omiten de manera intencional o inconsciente en los artículos destinados al público en general.
Se explica la importancia del tamaño de la muestra y su relación con el tipo de población. Se dan ejemplos de manipulaciones del tamaño de la muestra:
- Prueba de la eficacia de la pasta de dientes. Se están realizando pruebas de laboratorio del efecto del uso de pasta de dientes en seis sujetos. A veces se llevan a cabo varios de estos estudios y el estudio que mostró un resultado beneficioso para el cliente (fabricante de pasta) se utiliza en campañas publicitarias.
- Prueba de vacuna contra la poliomielitis. 450 niños fueron vacunados, 680 no fueron vacunados (grupo de control). Poco tiempo después, estalló una epidemia en la zona, los niños vacunados no tuvieron ni un solo caso de infección de poliomielitis. Tampoco ninguno de los miembros del grupo de control. El experimento se hizo inútil desde el principio debido a la elección incorrecta del número de participantes, ya que no se pueden esperar más de dos casos de infección en un grupo de este tamaño.
Se introducen conceptos:
Sobre el ejemplo de la escala de desarrollo de Hesselhabla sobre el peligro de percibir una evaluación puntual (fuera de intervalo) del valor promedio: los padres comienzan a entrar en pánico si su hijo no cumple con la norma (valor promedio).
Se llama la atención sobre la importancia de la redacción en artículos basados en estadísticas. Como ejemplo, considere la declaración de las compañías de suministro de electricidad (1948): "La energía eléctrica está disponible para más de 3/4 de las granjas en los Estados Unidos". La palabra "accesible", que no se define de ninguna manera en la solicitud, no tiene sentido; por lo general, significa que la línea eléctrica está ubicada a una distancia de 10 a 100 millas (16 a 160 km) de la granja, pero algo otra cosa puede entenderse como accesibilidad. El autor también señala que al interpretar los mismos datos, se podría poner el énfasis opuesto, escribiendo: "La energía eléctrica no está disponible para una cuarta parte de las granjas estadounidenses".
El capítulo termina con un recordatorio de la importancia de tener números en los gráficos: un gráfico del crecimiento de las ganancias de una empresa durante varios años (publicado en la revista Fortune) no le dice nada al lector porque el eje y no tiene etiquetas numéricas. A partir de ese gráfico, es imposible saber si el crecimiento de las ganancias fue significativo, promedio o cercano a cero.
Mucho ruido y pocas nueces
Los conceptos de intervalo de confianza y nivel de confianza se ilustran con ejemplos de la vida real:
- La diferencia en las puntuaciones de las pruebas de coeficiente intelectual entre 98 y 101 hace que sea imposible saber qué sujeto tiene un coeficiente intelectual más alto, como se puede ver en el registro completo de los resultados de las pruebas: 98 ± 3 y 101 ± 3, respectivamente.
- La medición del contenido de sustancias nocivas en varias marcas de cigarrillos reveló la ausencia de diferencias significativas entre ellas. Sin embargo, una de las marcas estaba en el último lugar en términos de contenido de sustancias nocivas (¡aunque con un margen insignificante del primer lugar!). El fabricante de estos cigarrillos (Old Gold) lanzó una campaña publicitaria en la que aseguraba que los cigarrillos Old Gold contenían las sustancias menos nocivas, según un laboratorio independiente.
El horario es tan bueno como parece
El primero de los capítulos dedicado a la consideración de formas de manipular con la ayuda de información gráfica.
Considera formas de distorsionar la percepción de los gráficos:
- "Comprimir" parte de la cuadrícula de coordenadas, aparentemente para ahorrar espacio. En realidad, conduce a dificultades en la percepción de la escala.
- Cambio de escala a lo largo de los ejes de abscisas y ordenadas. Este método le permite "convertir" (visualmente) el crecimiento, cercano a cero, en un pronunciado sostenible. Como ejemplo, se da el gráfico de crecimiento de los subsidios del gobierno que figura en uno de los anuncios. El aumento fue solo del 4 %, pero visualmente parecía casi un 400 % debido al aumento en la escala a lo largo del eje y.
Imagen esquemática
Comprender formas de engañar a la audiencia con la ayuda de infografías .
El uso de objetos gráficos asociados con la información que se presenta abre amplias oportunidades para el abuso. Esta afirmación se ilustra con una serie de ejemplos:
- Para comparar dos salarios, puedes usar infografías y dibujar dos bolsas de dinero. Si el segundo salario es el doble del primero, entonces la segunda bolsa no solo será más alta, sino también el doble de ancha (lo cual es necesario para mantener la proporción). Y dado que la bolsa es un objeto tridimensional, el contorno de la segunda bolsa será el doble de grueso que el de la primera. Como resultado, nuestra visión percibe la segunda bolsa como una bolsa 8 (¡no 2!) veces más grande que la primera. Esta técnica fue utilizada por la revista Newsweek.
- Un anuncio del Instituto Estadounidense del Acero y las Aleaciones utilizó una infografía para mostrar un aumento en la producción de acero entre 1930 y 1940 en 4,25 millones de toneladas (de 10 millones a 14,25 millones). La técnica infográfica (se agregó la distorsión deliberada de proporciones a los métodos discutidos anteriormente) condujo al hecho de que el aumento indicado en la fundición se percibió visualmente como 1500%. El autor señala que este es el caso cuando "la aritmética se convierte en fantasía".
- Usar imágenes de vacas de diferentes tamaños para mostrar diferentes rendimientos de leche a lo largo de los años. Además de los efectos ya discutidos, este método conduce a otro malentendido: el lector puede pensar que no solo la producción de leche ha aumentado, sino que las vacas también son más grandes.
La siguiente figura muestra un ejemplo de abuso infográfico: el segundo objeto es visualmente 8 veces más grande:
Figura pseudo-justificada
El capítulo comienza con una recomendación mordaz: "Si no puede probar lo que quiere, entonces demuestre otra cosa y finja que estas cosas son iguales".
Hay muchos ejemplos de este tipo de estafas. En particular:
- La emisión de una encuesta de opinión de las personas sobre la igualdad de oportunidades para blancos y afroamericanos para conseguir un trabajo para la situación real en el mercado laboral. Esta encuesta puede arrojar mejores resultados cuantas más personas con prejuicios raciales contra los afroamericanos participen en ella, ya que estos encuestados tienden a creer que no existe discriminación racial en el mercado laboral.
- Los anuncios de cigarrillos usaban el siguiente argumento: "Más del 27% de una muestra grande de médicos conocidos fuma Throaties, la tasa más alta de cualquier marca de cigarrillos". El anuncio sugería implícitamente que los médicos sabían algo especial, desconocido para el resto, sobre el daño causado por varias marcas de cigarrillos. Pero no lo es.
- Un anuncio de un exprimidor afirmaba que las pruebas de laboratorio mostraban que exprimía un 26% más de jugo. Cuando se hizo la pregunta: "¿que qué?", Se recibió la respuesta: "que un exprimidor de cono manual". Incluso si la declaración original es cierta, no le permite comparar el producto anunciado con los productos de la competencia. Puede que sea el peor del mercado, pero aun así supera a un exprimidor manual en un 26 % en eficiencia de extracción.
- La mortalidad en la Armada durante la Guerra Hispanoamericana fue del 0,09%. Para los civiles en Nueva York en el mismo período, fue del 0,16%. La Marina usó estos números para hacer campaña para el servicio militar. Pero es incorrecto comparar estos indicadores: se reclutan personas jóvenes y sanas en la flota, y se reclutan bebés, ancianos y enfermos en la población civil.
De nuevo, “después se debe a”
Este capítulo habla sobre el concepto de correlación y la confusión que suele surgir entre causa y efecto. Si los fenómenos A y B ocurren juntos, esto se puede explicar de tres maneras:
- El fenómeno A es una consecuencia del fenómeno B.
- El fenómeno B es una consecuencia del fenómeno A
- Los fenómenos A y B son consecuencias de otro/otros fenómenos
Se dan varios ejemplos de juicios erróneos sobre las relaciones causales. En particular:
- Los estudios han demostrado que hay más malos resultados entre los estudiantes que fuman que entre los no fumadores. Este hecho fue utilizado en la campaña antitabaco. Pero no se puede concluir de este resultado que fumar tenga un efecto negativo en las capacidades de los estudiantes. Es posible que los estudiantes hayan comenzado a fumar por un bajo rendimiento académico, o que no estudien bien y fumen por alguna tercera razón (por ejemplo, condiciones de vida difíciles).
- Las investigaciones muestran una correlación positiva entre el nivel educativo y los ingresos. No se puede concluir de este hecho que si usted (su hijo, hija, etc.) obtiene una educación superior, entonces ellos ciertamente y necesariamente tendrán un ingreso mayor que si no la recibieran. Además, esta correlación no permite concluir como regla general que es la educación superior la que conduce a mayores ingresos -quizás quienes la han recibido provienen de familias adineradas y por eso reciben mayores ingresos en la edad adulta. Aquí hay un ejemplo de un error post hocConsulte también Errores lógicos .
- Un estudio de 1500 graduados universitarios típicos de mediana edad mostró que el 93 % de los hombres estaban casados (frente al 83 % de la población general), mientras que solo el 65 % de las mujeres estaban casadas. De esto se concluye que una mujer educada tiene menos probabilidades de casarse que una sin educación. Pero el estudio no muestra una relación causal entre estos fenómenos. Quizás estas mujeres solteras habrían permanecido solteras incluso si no se hubieran graduado de la universidad.
El capítulo termina con un ejemplo casi anecdótico (pero real) de la confusión de causa y efecto por parte de los nativos de las Nuevas Hébridas. Creían que la presencia de piojos conduce a la salud. Se llegó a esta conclusión sobre la base de que los piojos abandonaron a la persona enferma (porque, debido al aumento de la temperatura corporal, las condiciones de vida para ellos se volvieron incómodas), mientras que todas las personas sanas los tenían (en otras palabras, hubo una correlación positiva entre la salud y la presencia de piojos).
Cómo producir estadísticas
Las estadísticas son manipulaciones estadísticas. En este capítulo, el autor muestra una vez más cómo manipular datos estadísticos usando ejemplos específicos. Sin embargo, insta a no rechazar indiscriminadamente los datos estadísticos, sino a estudiarlos concienzudamente, a fondo, con cautelosa incredulidad, antes de tomar nota.
Cómo poner las estadísticas en su lugar
El autor propone comprobar los datos estadísticos con la ayuda de cinco sencillas preguntas:
- ¿Quién está hablando?
- ¿Cómo él sabe esto?
- ¿Lo que falta?
- ¿Se cambia el objeto de estudio?
- ¿Tiene sentido?
Ediciones en otros idiomas
En ruso
- Darell Huff. Cómo mentir con estadísticas = Cómo mentir con estadísticas. — M .: Editorial Alpina , 2015. — 163 p. — ISBN 978-5-9614-5212-9 .
Notas
- ↑ "Durante los últimos cincuenta años, How to Lie with Statistics ha vendido más copias que cualquier otro texto estadístico". JM Steele. Darrell Huff and Fifty Years of How to Lie with Statistics Archivado el 23 de febrero de 2021 en Wayback Machine . Statistical Science , 20(3), 2005, 205-209.
Enlaces