Urgente Grandes retenciones en la A-8, el Txorierri y la Avanzada, sentido Cantabria, por la avería de un camión
Mikel Casal
Ciencia y tecnología

La denigrada e indispensable estadística

Matemáticas ·

Hoy se usa para estudiarlo todo: del cambio climático al coronavirus o la calidad de los alimentos

mauricio-josé schwarz

Viernes, 13 de noviembre 2020, 00:10

En la historia de nuestra relación con los números, pocas disciplinas están tan presentes como la estadística. La usamos para predecir cosas tan diversas como el resultado de procesos electorales o la aceptación que puede o no tener un producto. Pero es también una disciplina ... sospechosa, como lo atestigua la frase de origen desconocido popularizada por el escritor Mark Twain: «Hay tres tipos de mentiras: mentiras, malditas mentiras y estadísticas».

Publicidad

La estadística se define como la disciplina matemática dedicada a recopilar, organizar, analizar, interpretar y presentar conjuntos de datos para establecer comparaciones y determinar cómo varían a fin de comprender ciertos fenómenos y hacer inferencias sobre ellos.

Uno de los primeros usos de la estadística fueron los censos que se llevaron a cabo en el antiguo Egipto, Grecia, Israel, China y, los más conocidos, Roma. El conocimiento de cuántos ciudadanos o súbditos o esclavos había en cada lugar del imperio permitía a Roma cobrarles impuestos a todos de acuerdo a su situación.

El primer uso práctico de los métodos estadísticos del que tenemos noticia lo cuenta Tucídides en su Historia de la guerra del Peloponeso: a fin de determinar la altura que debían tener las escalas para asaltar la ciudad de Platea, los atenienses hicieron que varios soldados contaran el número de hileras de ladrillos que había en una sección de la muralla defensora. Se decidió que el valor más probable era el recuento que con más frecuencia reportaban los soldados. (Ese recuento más frecuente hoy se llama 'moda' y es una de las formas de manejar los valores de un recuento estadístico, junto con la media o promedio y la mediana.) Multiplicando ese número por la altura de los ladrillos, se fabricaron escalas adecuadas.

Publicidad

En cuanto a su expresión matemática, la estadística también surge a resultas de los intentos de estudiosos de la edad de oro del Islam ilustrado por desarrollar técnicas criptográficas, es decir, para descifrar claves secretas. En el siglo VIII, el matemático Al-Kindi, el padre de la filosofía árabe desarrolló un método mediante el cual las variaciones en la frecuencia de las letras se podía analizar y usar para romper códigos.

La estadística está hoy presente en prácticamente todos los aspectos de nuestra vida. Las primas de seguros y los intereses sobre créditos los determina la ciencia actuarial, que usa métodos estadísticos para valorar los riesgos y asignarles valor. La demografía o estadística de poblaciones nos muestra cómo cambia una sociedad al paso del tiempo, sus lugares de residencia, sus movimientos migratorios y sus cambios socioeconómicos. Usamos la estadística para estudiar la calidad del aire y del agua, las poblaciones animales y vegetales y el clima; es el análisis estadístico de las temperaturas el que ha determinado sin lugar a dudas la existencia del cambio climático y la función que la actividad humana tiene en él. Es herramienta clave en el control de calidad de productos, alimentos y medicamentos, que se muestrean estadísticamente para conocer el estado de la producción sin analizar cada elemento individual.

Publicidad

Hay muchas otras aplicaciones, pero dos están presentes en nuestra vida hoy con una relevancia especial.

Las mentiras estadísticas a las que se refería Twain son en realidad malos usos de esta técnica

Aprendizaje

El aprendizaje de máquina, al que tanto le temen quienes menos saben de él, es una parte de la Inteligencia Artificial que funciona mediante algoritmos que toman ciertos datos de muestra para producir modelos que van refinando conforme manejan más datos. Es una forma de 'aprendizaje estadístico' que también utilizamos los seres humanos. Un sistema de reconocimiento facial, por ejemplo, puede empezar con datos muy sencillos: un objeto oval con dos puntos y una raya, la carita más simple que podemos dibujar, es una cara… otras cosas no lo son. Conforme el algoritmo se ve expuesto a más imágenes, va mejorando su capacidad de reconocer caras y no confundirlas con otras cosas que pueden parecer caras, como el frente de un automóvil.

Pero, sobre todo, hoy en día mucha gente está hablando de métodos estadísticos confiando en su precisión y capacidad de informarnos sobre algo tan relevante como la pandemia de COVID-19 causada por el coronavirus SARS-COV2. El número de contagios por 100.000 habitantes, las tasas de eficacia prevista de las vacunas que están en estudio, la tasa de mortalidad causada por el virus, la eficacia de tal o cual tipo de mascarillas la probabilidad de ser contagiados en diversos entornos… todo cuanto estudian la epidemiología y disciplinas afines como la infectología, se expresa en estadísticas que nos informan puntualmente del panorama de esta amenaza a nivel mundial, de cómo se desarrolla, de cuán eficientemente la estamos combatiendo y de qué expectativas tenemos de superarla de la mejor manera.

Publicidad

Pero queda el problema de la estadística como parte de las mentiras de las que se quejaban Twain y otros. En general, esas estadísticas suelen referirse a un mal uso de los métodos de la estadística (un fraude científico puro y simpe) o, sobre todo, a los problemas que implican las encuestas donde, como decíamos, se intersectan las volubilidades humanas y las matemáticas. Para que las opiniones o percepciones de la gente sean estudiables estadísticamente se deben poder medir, y generalmente el problema está en la forma en que se miden.

Todos conocemos las encuestas de medios de comunicación donde los resultados están sesgados por la ideología que comparten el medio y su público, el que generalmente responde a ellas. La selección de la población a encuestar, el medio (teléfono, email, Twitter, visita personal, selección en la calle, en qué calle, a qué hora) y la redacción de las preguntas son algunos elementos que deben cuidarse porque es sencillo manipularlos para que den los resultados que convengan al diseñador de la encuesta. Es así verdad que se puede mentir con estadísticas, pero eso no es culpa de la disciplina en sí, sino del mal uso que se hace de ella como se puede hacer de cualquier conocimiento.

Publicidad

Datos abundantes, Big Data

La idea de Big Data no se refiere en realidad a una forma diferente de abordar los conjuntos de datos con los que trabaja la estadística, sino a las limitaciones de los equipos informáticos que simplemente pueden no tener capacidad de manejar el volumen de los datos, su variedad y la velocidad a la que se recopilan. Y hoy, gracias a elementos como el internet de las cosas, se pueden recopilar vastísimas cantidades de datos en muy poco tiempo y que pueden ser enormemente valiosos por igual en cuanto a proyecciones de negocios que para salvar vidas. De allí que la informática se ocupe de ampliar constantemente su capacidad de manejar esos abundantes datos de modo estadísticamente correcto.

Este contenido es exclusivo para suscriptores

Accede todo un mes por solo 0,99€

Publicidad