El p-valor
El azar impregna nuestras vidas. Las cosas pueden suceder por una causa o, en más casos de los que imaginamos, por puro azar o pura casualidad; y es importante saber cuándo es por una razón u otra. Por ejemplo, imaginemos que hacemos una apuesta en la que ganamos si sale cara y perdemos si sale cruz. Ahora apostamos y se lanza la moneda al al aire. Sale cruz. Volvemos a hacer apuestas y vuelve a salir cruz. Lo mismo en el tercer lanzamiento. Entonces, nos planteamos: ¿está trucada la moneda? ¿o nuestro adversario es totalmente honrado y simplemente ha tenido suerte? ¿tenemos alguna forma de saber una cosa así?
La respuesta es que nunca lo podremos saber con total seguridad, pero sí tenemos un indicador que nos dice lo probable o improbable de que un hecho así haya sucedido por azar.
Aunque posiblemente os haya parecido que sea un ejercicio puramente académico y sólo sirva para poner enunciados de exámenes, no es así. Imaginad que en vez de lanzar una moneda al aire estamos hablando de probar la eficacia de un medicamento del que afirman que cura una enfermedad que es mortal en el 50% de los casos y hacemos la prueba de ese medicamento con tres personas que padezcan dicha enfermedad. La solución, matemáticamente hablando, es exactamente igual que el problema de la moneda, pero lo que está en juego es mucho más delicado. La pregunta es, ¿ese medicamento funciona? La respuesta que demos al problema de las monedas es exactamente el mismo que demos al resultado de ese estudio. Si las tres personas que han tomado dicho medicamento se curan, entonces, ¿podemos afirmar que realmente funciona?
Para separar las conclusiones reales del puro azar existe un parámetro que los estadísticos llaman ‘p-valor’. Se trata de conocer la probabilidad de que ese resultado sea por azar o realmente por una causa determinada que es la cuestión de estudio; en nuestro caso, que la moneda esté trucada o que el medicamento realmente funcione.
La probabilidad de que salga cara o cruz en el caso de que la moneda no esté trucada es de un 50%, así que tirar tres veces y que salgan tres caras sería 0, 5*0, 5*0, 5=0, 125, o sea, el 12, 5% de las veces. Afirmamos entonces que el p-valor es del 12, 5%. En otras palabras, la probabilidad de que salgan tres caras por puro azar es del 12, 5%. Visto desde otro punto de vista. Imaginad que tiramos una moneda tres veces y estas tres tiradas las consideramos como un bloque. Pues bien, si hacemos este bloque 100 veces, de ellas, aproximadamente 12 nos saldrán tres caras por puro azar.
Entonce, ¿qué información da el p-valor? Básicamente, que si es alto, el resultado obtenido puede ser perfectamente por pura probabilidad o puro azar, y que el experimento que estás haciendo (en este caso, lanzar una moneda al aire) no sirve para poder concluir que la moneda está trucada; y si el p-valor es muy bajo, entonces, el resultado sí nos sirve para concluir que la moneda está realmente trucada.
Bien, la siguiente pregunta es, ¿qué p-valor es el que debemos considerar para poder decir si es alto o bajo?
En nuestro caso, el p-valor, tanto en el experimento de las monedas como en el del análisis clínico, es del 12, 5%. La conclusión es que no podemos diferenciar los resultados de dicho medicamento del puro azar (puesto que la enfermedad era mortal en el 50% de los casos y no podemos saber si ha sido el medicamento quien la ha curado o simplemente ha curado por sí mismo). En el caso de la moneda, no podemos concluir que está trucada.
¿Qué podemos hacer para disminuir el p-valor? Ya lo habréis intuido: aumentar el número de experiencias. Si en vez de tres tiradas de moneda o tres pruebas de ese medicamento tendríamos el 50% multiplicado por sí mismo 5 veces y tendríamos un p-valor del 3, 1%. En ese caso, al no superar el 5% consideramos esa correlación significativa. Si a tu amigo le salen 5 caras seguidas ya puedes empezar a sospechar que aquí pasa algo raro.
El que consideramos límite para decir que algo es fruto del azar o que hay una razón de fondo es del 5%. Dicho criterio fue establecido en 1920 por Ronald Aylmer Fisher, un biólogo británico y uno de los padres de la inferencia estadística moderna, que encontró la cifra apropiadamente pequeña y matemáticamente cómoda. Este límite está muy extendido en la ingeniería y en el caso del contexto jurídico se le considera el equivalente de estar ‘más allá de toda duda razonable’.
Pero la cifra es arbitraria, y aunque parezca pequeña tenéis que pensar que permite que 1 de cada 20 estudios médicos pueda ser erróneos. Hay estadísticos que lo reducen al 1%, lo que traducido a nuestro experimento equivaldría a 7 personas en el ensayo clínico o que salieran 7 caras seguidas en una moneda. El propio Fisher admitió que si uno de cada veinte estudios no parecía una probabilidad lo suficientemente alta, se podía trazar también la línea en uno entre cincuenta o uno entre cien.
Recordemos siempre, por tanto, que el p-valor constituye una indicación de la confianza que podemos depositar en unas conclusiones, así que la próxima vez que te citen un estudio médico, pregunta por el p-valor. Y recordemos siempre que las cosas pueden ocurrir por casualidad.
Una bonita historia relacionada con el tema que os acabo de explicar fue protagonizada por el formidable Enrico Fermi. Ya os la conté, pero vale la pena recordarla. El no menos formidable Carl Sagan nos explicaba la anécdota:
– Fulano de tal es un gran general – le dijeron.
– ¿Cuál es la definición de un gran general? – preguntó Fermi como era típico en él.
– Se supone que es un general que ha ganado muchas batallas consecutivas.
– ¿Cuántas?
Después de sumar y restar un poco, se fijaron en cinco.
– ¿Qué fracción de generales americanos son grandes?
Después de sumar y restar un poco más, se fijaron en un pequeño tanto por ciento.
– Pero imaginemos – replicó Fermi – que no existe algo así como un gran general, que todos los ejércitos son iguales y que ganar una batalla es puramente un asunto de probabilidades. Entonces, la probabilidad de ganar una batalla es una de dos, o sea, 1/2; la de ganar dos 1/4; tres 1/8; cuatro 1/16 y cinco 1/32 que es cerca del 3%. Es lógico esperar que un pequeño tanto por ciento de generales americanos venzan cinco batallas consecutivas por pura casualidad. Ahora bien, ¿alguno ha ganado diez batallas consecutivas?
Fuentes:
Jeffrey S. Rosenthal, A cara o cruz.
Carl Sagan, El mundo y sus demonios.
Añade tu comentario
Comentarios de El p-valor
Sobre esta noticia
Autor: Fernandoalamo (28 noticias)
Fuente: historiasdelaciencia.com
Visitas de esta noticia: 231
Tipo: Reportaje
-
1Cambios en rutas comerciales "contribuyeron al colapso maya"
-
2Los tres artrópodos más curiosos de 2011
-
3"La vacuna contra el cambio climático a lo mejor la tenemos en la geotermia"
-
4Origen genético de los perros el ‘gran misterio’
-
5Cada agujero negro contiene un nuevo universo
-
6El origen genético de los perros sigue siendo un misterio










