Al igual que probablemente hayan leído más de una vez, el cálculo de probabilidades tiene su origen en los intentos de comprender y predecir el comportamiento de los juegos de azar (los juegos son tan antiguos De exactamente la misma forma que la propia humanidad), y más concretamente los de apuestas. En el siglo XVI dicha preocupación coge cierto apogeo ( se percibe que la gente quiere enriquecerse veloz, Si es que bien La mayor parte lo cual logra realmente es el efecto contrario, en otros términos, arruinarse) y se pregunta a los matemáticos. Sus explicaciones teóricas, muchas veces, no satisfacen a los jugadores, y menos Aún en la fecha observan que hay Ciertas contradicciones conque dice la teoría y lo que sucede experimentalmente en las mesas de juego (es célebre el problema del caballero de Méré, que Indudablemente conocerán). El caso es que no Sólo a los jugadores Sino que También a los matemáticos puros no acaba de convencerles esta nueva faceta de las matemáticas, ese intento de dominar los fenómenos aleatorios, que consideran imposible. Pero, ya entrado el siglo XVII, matemáticos de cierto renombre van proponiendo procedimientos para dotar de rigurosidad a estos temas. Pese a ello, continua habiendo reticencias (los puristas consideran la matemática Del mismo modo que una ciencia exacta, perfecta, donde no caben estimaciones o porcentajes de acierto). Con estos precedentes, en 1763 se publica de manera póstuma la álbum de Thomas Bayes (1702 – 1761), donde desarrolla el famoso Teorema de Bayes, germen de la Inferencia Bayesiana, una importante rama de la Estadística vigente. Es un resultado que quizás (jamás mejor utilizado el adverbio) recuerden más Tal y como una fórmula que nos deja calcular la probabilidad condicionada, siendo A y B dos sucesos, con B con probabilidad positiva (a fin de que no se anule el denominador). La p(A|B) denota la probabilidad de que suceda A, sabiendo que ha acontecido B. Expresado de otra forma, contar cierta información, ¿modifica la probabilidad de que ocurra un evento? La respuesta es afirmativa, Pero hay que saber usar bien la expresión precedente Porque, En oportunidades, podemos sacar conclusiones equivocadas. Primero veamos un ejemplo sencillo de de qué manera puede quedar afectada una probabilidad teniendo cierta información adicional. Supongamos que tenemos una bolsa cerrada y opaca en la que hay tres bolas rojas y dos azules. Sacamos dos bolas. La probabilidad de que la 2da sea roja es 3/5, o sea, 0.6 (¿Sabría el lector por qué?). Pero si es que sabemos que la 1era se dirigió azul, ¿cuál es la probabilidad de que la segunda sea roja? En un caso así, Tal como podemos simular todos y cada uno de los casos por medio de un sencillo esquema, no haría falta recurrir a la formula anterior (Aunque se recomienda al lector que lo intente a ver si es que le sale lo mismo), comprobando que si la primera se dirigió azul (o bien sea, quedarían en la bolsa una azul y tres rojas), entonces que la segunda sea roja lo tendríamos con probabilidad de 3/4, o bien sea, 0.75, la posibilidad de quitar roja en segundo sector aumenta mucho. Otro ejemplo habitual y muy difundido Porque aparece en series de televisión (Numb3rs, episodio 1x13.-La caza del hombre), películas (21 Blackjack, Robert Luketic, EE. UU., 2008) y hasta novelas (El curioso acontecimiento del perro a medianoche, Mark Haddon) es el de la llamada paradoja de Monty Hall, estrategia típico de los concursos de televisión (Al idéntico que nuestro célebre Un, dos, Tres), en el que el presentador insta al concursante a que decida si es que mantenerse o bien cambiar de elección de posible regalo ahora de haberle mostrado alguna de las opciones iniciales. Pero, entre los propios matemáticos esta fórmula tampoco estuvo exenta de controversias, distinguiéndose dos grupos: los seguidores de la estadística tradicional que Sólo admiten cálculos con probabilidades basadas en experimentos repetibles y con confirmación empírica, y los llamados estadísticos bayesianos que aceptan probabilidades “subjetivas”, es decir, con datos adicional de los hechos. Un conocido ejemplo de sus objeciones es la denominada paradoja del cuervo (o paradoja de Hempel, planteada por el filósofo alemán Carl Hempel (1905 – 1997)). Antes de enunciarla, generalicemos la fórmula de Bayes, citada Antes para Sólo dos eventos. Si tenemos un grupo de acontecimientos mutuamente excluyentes {A_1, A_2, …, A_n} de los cuales necesariamente ocurre uno (o sea, la unión de todos ellos es el espacio muestral completo), y semejantes que la probabilidad de cada uno de ellos es distinta de cero, y B un acontecimiento cualquiera con probabilidad positiva del que se conocen las probabilidades condicionales p(B|A_k), para todos y cada uno de los k A partir de 1 a n, luego, la probabilidad condicionada p(A_k | B) viene dada por la expresión: Si bien lo cual comento ahora pueda parecer sumamente técnico (de eso que la gente piensa que Solo nos agrada y entienden los matemáticos), es precisamente la idea por la que hay que disponer cuidado al aplicar la fórmula de Bayes, y que justifica perfectamente por qué no funciona en el caso de la paradoja del cuervo. En este sentido tal como los A_k hemos indicado que son mutuamente excluyentes y necesariamente ocurre uno, resulta que Sólo uno de los sucesos de los paréntesis (al ser una intersección, quiere decir que ocurren a la vez A_k y B) sucede, con lo que la probabilidad total es una suma: Esta expresión es útil en la práctica por el hecho de que suele ser más simple calcular todas y cada una las p(B|A_k) que la p(B). Y De este modo se conforma la fórmula de Bayes tal y Al idéntico que la están estudiando estos días los Estudiantes que se presentan a la EBAU: Seguramente lo entendamos perfectamente con un sencillo ejemplo. Volvamos con los temas doctores (sitio frecuente en el que se utiliza la fórmula de Bayes; seguimos ahondando en que este ámbito profesional Necesita las matemáticas de un modo claro), retomando el hilo de la reseña de la semana pasada. Supongamos que la probabilidad de que un paciente tenga los síntomas del COVID-19 teniendo la enfermedad es alta, de 0.9 (los números son inventados, no responden a la realidad, Solo los coloco a efectos de comprender la fórmula de Bayes y observar su efecto). Dicho en los términos anteriormente descritos, el evento B será el de disponer los síntomas, al tiempo que A_1 es padecer la enfermedad, y A_2 no tenerla. Los sucesos mutuamente excluyentes en este caso son claros: poseer la enfermedad, Por un lado, y no tenerla, por otro. Y la unión de Los dos es el grupo de los pacientes en suma. El dato anterior sería luego la probabilidad condicionada p(B|A_1) = 0.9. Si es que el paciente no tiene la enfermedad, la probabilidad de que tenga síntomas será baja, pongamos que 0.15. Conocemos De la misma forma la prevalencia de la enfermedad, expresado de otro modo, el porcentaje de la población que ha desarrollado la enfermedad, digamos que ha sido de un 20%. En términos de probabilidades (ya saben, no podemos mezclar churras con merinas, tampoco en matemáticas), ese porcentaje corresponde a p(A_1) = 0.2. Por ende, p(A_2) = 0.8. La probabilidad de que alguna persona tenga los síntomas, p(B), es la unión de los hechos disponer el COVID y los síntomas, más la probabilidad de que alguna persona no tenga el COVID, No obstante sí los síntomas. Entonces Entonces, expresado de otro modo, de todos y cada uno de los pacientes con síntomas, detectamos correctamente el COVID en el 60% de los casos. Cuevos, Sherlock Holmes y Bayes Aunque es muy conocido y difundido, no A mí me resisto a recordar la paradoja del cuervo. Tomamos una muestra de un millón de cuervos. Los observamos y establecemos la conclusión de que “Todos los cuervos son negros”. La conclusión parece razonable de contrato con el principio de inducción. Si es que bien, de pacto a las reglas de la lógica, Cuando tenemos una proposición P implica otra Q, es equivalente a decir que, si es que Q es falsa, luego P es falsa. Aplicado a la sentencia precedente eso significa que “Todas las cosas que no son negras, no son cuervos”. Quiere esto decir que cualquier objeto verde, rojo, o bien de cualquier color que no sea negro que encontremos refuerza la idea de que los cuervos son negros. Es extraño pues el conjunto de todas y cada una de las cosas que no son negras es en comparación muchísimo mayor que el conjunto de los cuervos. Aunque, si utilizamos la fórmula de Bayes, observando numerador respecto al denominador, un conjunto de objetos pequeño, apenas influye en el resultado terminante del otro evento. En la novela El signo de los cuatro, Arthur Conan Doyle habla del arte de la deducción y pone en la boca de su conocida creación, el lógico Sherlock Holmes, la proxima afirmación: “Cuando han sido descartadas todas y cada una y cada una de las explicaciones imposibles, la que queda, por inverosímil que parezca, debe ser la verdadera”. Del mismo modo que el principio de reducción al absurdo, tan empleado en las demostraciones matemáticas. No obstante, hay algo que También la fórmula de Bayes nos advierte: ¿es posible contemplar todas y cada una de las posibles situaciones A_k? ¿Son acaso mutuamente excluyentes? Tanto en esta situación Al idéntico que en la paradoja del cuervo los Grupos son enormes, inabarcables (las posibles explicaciones a un crimen y los objetos no negros) y eso es lo que nos lleva a las paradojas y los absurdos. Semejante que una medicación tiene sus especificaciones y sus incompatibilidades, administrar un teorema o bien una proposición matemática requiere contar muy en cuenta sus hipótesis, pues si no, podemos “cargarnos al paciente”. A partir de que se publicara el trabajo de Bayes en 1763, la noción de probabilidad subjetiva es retomada por el austriaco Bruno de Finetti (1906 – 1985) en 1937. Es célebre su oración “la probabilidad no existe”, aludiendo a la necesidad de un recambio de filosofía en su desenvolvimiento. En 1950, Leonard Jimmie Savage (1917 – 1971) y Dennis Lindley (1923 – 2013) establecieron las bases de la inferencia bayesiana y sus aplicaciones a la teoría de juegos. A finales de los años sesenta del siglo pasado, con el crecimiento de la informática, figuran varias análisis bayesianos en particular en áreas Del mismo modo que la medicina (véase, por poner un ejemplo, este estudio ). En 1992, se funda la International Society for Bayesian Analysis, ISBA, (Sociedad Internacional para el Análisis Bayesiano). En la actualidad continua habiendo Algunas divisiones entre los partidarios de la probabilidad “objetiva” y los bayesianos, no por el uso del teorema y su fórmula, que matemáticamente es impecable, Sino más bien que más bien En cuanto a la interpretación de la probabilidad De este modo tal como grado de creencia, incorporando opiniones subjetivas en el análisis de los información y la información (decidiendo, por poner un ejemplo, acerca de la culpa o inocencia de un detenido de pacto a las probabilidades de disponer o bien conducir o bien no armas de fuego; o bien establecer relaciones entre hechos Del mismo modo que disponer cáncer de pulmón con el hábito de fumar; El jornada de hoy nos semeja claro, Sin embargo en 1951 en la fecha Jerome Cornfield lo hizo, tuvo que rescatar Múltiples escollos). Para terminar, veamos si han entendido estos dos últimos artículos (lo de ser médico Necesita de más tiempo): imaginemos una enfermedad que sufre el 1% de la población, enfermedad que presenta unos síntomas claros. Supongamos que existe una demuestra, un test, que es fiable en un 99%, es decir, que, teniendo la enfermedad, el test da positivo el 99% de las veces, y no teniéndola, da negativo Además el 99% de las veces. Tenemos los síntomas, nos hacemos el test y nos da positivo. ¿Qué deberíamos hacer si es que fuéramos doctores? ¿Debemos preocuparnos De La misma manera que pacientes? Alfonso Jesús Población Sáez es profesor de la Universidad de Valladolid y miembro de la Comisión de divulgación de la Real Sociedad Matemática Española (RSME). El ABCdario de las Matemáticas es una sección que surge de la colaboración con la Comisión de Divulgación de la RSME.