Por qué los números no son tan objetivos como pensamos
Miscelánea / / July 29, 2022
De hecho, son fáciles de manipular.
Cualquier declaración dudosa puede percibirse como verdadera si está respaldada por estadísticas, tablas, gráficos y términos científicos. Para no caer en tales trucos, es importante poder reconocer tonterías y, en general, comprender de qué se trata. Un nuevo libro de la editorial FOMIN "¡Todas las tonterías!" ayudará con esto. Fue escrito por el biólogo evolutivo, el profesor Carl Bergstrom y el profesor asistente de la Escuela de Información de la Universidad de Washington, Jevin West. Y Lifehacker publica un extracto del quinto capítulo.
Nuestro mundo está literalmente digitalizado. Todo está calculado, medido, analizado y evaluado. Las empresas de Internet nos rastrean en línea y usan algoritmos para predecir lo que compraremos. Los teléfonos inteligentes cuentan nuestros pasos, miden la duración de las llamadas y rastrean nuestros movimientos a lo largo del día. Los dispositivos inteligentes controlan cómo los usamos y saben más sobre nuestra rutina diaria de lo que podemos imaginar. Los dispositivos médicos implantados alimentan un flujo continuo de información del paciente y monitorean signos de peligro en tiempo real. Durante el mantenimiento, nuestros coches cargan datos sobre su rendimiento y nuestro estilo de conducción. La gran cantidad de sensores y cámaras instalados en las ciudades monitorean todo, desde los flujos de tráfico hasta la calidad del aire, e incluso son capaces de configurar
personalidades de los transeúntes.En lugar de recopilar datos sobre el comportamiento del consumidor a través de encuestas y encuestas costosas, las empresas permiten que las personas acudan a ellas por su cuenta y luego registran todo lo que hacen. Facebook* sabe a quién conocemos. Google - lo que queremos averiguar. Uber - donde pretendemos ir. Amazon - lo que queremos comprar. Partido: con quien planeamos crear una unión familiar. Tinder - de quien estamos esperando una invitación para comunicarnos.
Los datos pueden ayudarnos a comprender el mundo en términos de hechos objetivos, pero los datos no son tan objetivos como pensamos. Aquí me viene a la mente un viejo chiste. Un matemático, un ingeniero y un contador consiguen trabajo. Los llevan a una oficina y les dan un examen de matemáticas. La primera tarea, para calentar: ¿cuánto es dos más dos? El matemático pone los ojos en blanco, escribe "cuatro" y pasa a las siguientes tareas. El ingeniero piensa por un segundo, luego escribe "alrededor de cuatro". El contador mira a su alrededor con ansiedad, luego se levanta de su silla, se acerca a la persona que prueba, y en voz baja pregunta: "Antes de escribir nada, dime lo que quieres ¿obtener?"
Los números son perfectos para decir tonterías. Parecen objetivos, pero se pueden manipular fácilmente para contar la historia correcta.
Las palabras definitivamente son producidas por la mente humana, pero ¿qué pasa con los números? Los números parecen ser dados a nosotros por la naturaleza misma. Sabemos que las palabras son subjetivas. Sabemos que se utilizan para torcer y distorsionar la verdad. Las palabras reflejan intuición, sentimientos, pasión. Los números parecen existir separados de la persona que habla de ellos.
La fe de la gente en los números es increíblemente fuerte. Los escépticos afirman que "solo quieren ver los datos" o exigen que se les muestren "datos de referencia" o insisten en que "los números deberían hablar por sí mismos". Estamos convencidos de que “los datos nunca mentir». Pero esta vista puede ser peligrosa. Incluso si los valores o números son correctos, aún pueden usarse para engañar a la cabeza […]. Para que los números sean comprensibles, deben estar en un contexto apropiado. Deben demostrarse de tal manera que podamos disponer de una comparación honesta.
Primero pensemos de dónde vienen estos números. Algunos de ellos los obtenemos directamente, por conteo o medición precisos. Hay 50 estados en los EE.UU. Hay 25 números primos menores que 100. El Empire State Building tiene 102 pisos. La leyenda del béisbol Tony Gwin conectó 3,141 hits de 9,288 turnos al bate para un promedio de bateo de las Grandes Ligas de .388. En principio, un conteo preciso debería ser bastante sencillo. Hay una respuesta definitiva, y por lo general hay un determinado procedimiento de cálculo o medición que se puede utilizar para llegar a ella. Pero este proceso no siempre es fácil. Es muy posible cometer errores en los cálculos, las medidas o en lo que consideramos exactamente. Tome los planetas por ejemplo. sistema solar. Desde el momento en que se descubrió Neptuno en 1846 hasta que se descubrió Plutón en 1930, pensamos que había ocho planetas en el sistema solar. Después del descubrimiento de Plutón, dijimos que tenemos nueve planetas. Luego, en 2006, el desafortunado "recién llegado" fue degradado al estado de un planeta enano, y había ocho planetas completos girando alrededor del Sol nuevamente.
Sin embargo, lo más frecuente es que no sean posibles recuentos precisos o mediciones exhaustivas.
No somos capaces de contar por separado cada estrella en el observado Universopara llegar a la aproximación actual de billones de billones.
Del mismo modo, nos basamos en estimaciones aproximadas cuando observamos indicadores como la altura de un adulto en un país en particular. Los hombres de los Países Bajos son considerados los más altos del mundo: un promedio de 183 centímetros. Pero para obtener estos datos no midieron a todos los habitantes del país y no calcularon la media de todos los valores obtenidos. En cambio, los investigadores usaron una muestra aleatoria de hombres locales, midieron quién cayó en ella y extrapolaron los hallazgos a toda la población.
Si uno tuviera que medir a media docena de hombres y calcular su altura promedio, solo por casualidad el resultado sería incorrecto. Supongamos que algunos de ellos fueran inusualmente altos. Se llama error de muestreo. Afortunadamente, una muestra grande suele igualar las varianzas, por lo que dicho error tiene un efecto mínimo en el resultado.
También pueden surgir problemas con el procedimiento de medición. Digamos que los investigadores pidieron a los participantes que informaran sobre su altura, pero los hombres tienden a inflar los números, y los hombres bajos lo hacen con más frecuencia que los hombres altos.
Otra fuente de error, el sesgo de la propia muestra, es aún más peligrosa. Suponga que decide determinar la altura de las personas, fue a la cancha de baloncesto local y comenzó a medir a los jugadores. jugadores de baloncestonormalmente está por encima de la estatura promedio, por lo que su muestra no será representativa de la población general y terminará siendo demasiado alta. La mayoría de los errores de este tipo no son tan obvios. […]
En estos ejemplos, observamos grupos de personas en un rango de valores, por ejemplo, un rango de alturas, y luego agregamos esa información en un solo número, llamado estadística de resumen. Por ejemplo, al describir a un holandés alto, estamos hablando de una estatura promedio.
Las estadísticas resumidas pueden ser una forma conveniente de resumir la información, pero si no es correcta, puede engañar fácilmente a su audiencia.
Los políticos utilizan este truco cuando proponen presentar deducción fiscal, que ahorrará cientos de miles de dólares para el 1% más rico de los ciudadanos, pero de ninguna manera aliviará la carga fiscal de todos los demás. Toman la deducción fiscal promedio y afirman que su plan fiscal ahorrará a las familias un promedio de $4,000 al año. Tal vez sea así, pero la familia promedio, si nos referimos a la que se encuentra en el medio de la distribución del ingreso, no ahorrará nada. A la mayoría de nosotros nos resultará mucho más útil saber cuál será la deducción para una familia con un ingreso medio. En este caso, la mediana es el ingreso “mediano” entre la mitad de las familias que ganan más de este valor y la mitad de las familias que ganan menos de este valor. Por lo tanto, la familia mediana no recibirá ninguna deducción en absoluto, porque solo es útil para el 1% superior de la población con los ingresos más altos.
A veces no podemos medir directamente el indicador que nos interesa. Carl pasó recientemente bajo el radar de la Patrulla de Caminos en un tramo recto y llano de carretera en el desierto de Utah, donde por alguna razón inexplicable se estableció un límite de velocidad de cincuenta millas por hora. Se detuvo a un lado de la carretera, mirando los destellos familiares de luces rojas y azules en el espejo retrovisor. "¿Sabes a qué velocidad conducías?" preguntó patrulla. "No lo creo, oficial", respondió Carl. "Ochenta y tres millas por hora".
Ochenta y tres es un número serio, que potencialmente amenaza con un gran problema. ¿Pero de dónde vino? Algunas cámaras de tráfico calculan tu velocidad midiendo la distancia que recorres en un tiempo determinado, pero las carreteras estatales lo hacen de forma diferente. El policía estaba midiendo algo más: el cambio Doppler en las ondas de radio emitidas por su radar portátil cuando rebotaban en el coche de Carl a toda velocidad. El software integrado en el radar utiliza un modelo matemático basado en la mecánica ondulatoria para calcular la velocidad del vehículo utilizando las medidas que recibe. Como el patrullero no mide directamente velocidad Carla, el radar necesita ser calibrado regularmente. La forma estándar de deshacerse de una multa por exceso de velocidad es exigir que el oficial muestre registros de calibración oportunos. Cierto, Carl no lo necesitaba. Sabía que había excedido el límite de velocidad y se alegró de que por su prisa saliera con solo una multa, aunque grande.
Los radares se basan en principios físicos muy sólidos, pero los modelos utilizados para calcular otras métricas pueden ser más complejos e involucrar más suposiciones. La Comisión Ballenera Internacional publica datos sobre el número de poblaciones de algunas especies de ballenas. Cuando informa que hay 2.300 ballenas azules en las aguas del hemisferio sur, llega a este número no porque todas hayan sido encontradas y contadas. animal. Y no han peinado desde y hacia alguna parte del océano. Las ballenas no se quedan quietas y la mayoría de las veces no son visibles desde la superficie del agua. Por lo tanto, los científicos necesitan formas indirectas de determinar el tamaño de la población. Por ejemplo, cuentan encuentros con individuos únicos que pueden ser identificados por marcas en sus aletas caudales y cola. Entonces, su determinación del número de ballenas es tan inexacta como lo es esta técnica.
En cálculos y hechos que parecen completamente obvios, los errores se deslizan por varias razones. Puedes confundirte con los números. Puede utilizar una muestra demasiado pequeña, que refleja incorrectamente las características de todo el grupo. Los métodos por los cuales derivamos números de otra información pueden resultar incorrectos. Y finalmente, los números pueden ser simplemente una completa tontería, inventados desde cero en un intento de dar persuasión argumentos patéticos. Debemos tener esto en cuenta cuando se nos muestra algo por números. Se dice que los números nunca mienten, pero hay que recordar que a menudo son engañosos.
"¡Completa tontería!" habla sobre cómo se propaga la desinformación, por qué creemos en ella y cómo aprender a evaluar correctamente las relaciones causales. Este libro demuestra que no es necesario ser un experto en estadística para reconocer falsificaciones y conceptos cambiantes. Basta de lógica y pensamiento crítico.
Compra un libro
Leer también🧐
- Trampas de la percepción: cómo los sentidos distorsionan la realidad
- ¿Se está repitiendo la historia? ¿Es posible establecer paralelismos entre eventos pasados y presentes?
- Sesgo de confirmación: por qué nunca somos objetivos
- ¿Por qué la realidad objetiva no existe?
- ¿Por qué creemos más en conjeturas y rumores que en estadísticas?
*Actividades de Meta Platforms Inc. y sus redes sociales Facebook e Instagram están prohibidas en el territorio de la Federación Rusa.