PROBABILIDAD CONDICIONADA

Probabilidad condicionada

Como la probabilidad está ligada a nuestra ignorancia sobre los resultados de la experiencia, el hecho de que ocurra un suceso, puede cambiar la probabilidad de los demás. El proceso de realizar la historia clínica, explorar y realizar pruebas complementarias ilustra este principio.

La probabilidad de que ocurra el suceso A si ha ocurrido el suceso B se denomina probabilidad condicionada y se define

Descripción: http://www.hrc.es/bioest/Prob_ec2.gif

Esta definición es consistente, es decir cumple los axiomas de probabilidad.

Cuando ocurre un suceso cambia el espacio muestral, por eso cambia la probabilidad. A veces es más fácil calcular la probabilidad condicionada teniendo en cuenta este cambio de espacio muestral. 

Ejemplo 3:

Una mujer es portadora de la enfermedad de Duchenne ¿Cuál es la probabilidad de que su próximo hijo tenga la enfermedad?

Según las leyes de Mendel, todos los posibles genotipos de un hijo de una madre portadora (xX) y un padre normal (XY) son xX, xY, XX, XY y tienen la misma probabilidad. El espacio muestral es W = {xX, xY, XX, XY} 
el suceso A={hijo enfermo} corresponde al genotipo xY, por tanto, según la definición clásica de probabilidad 
p(A) = 1/4 = 0,25

La mujer tiene el hijo y es varón ¿qué probabilidad hay de que tenga la enfermedad?

Se define el suceso B = {ser varón} = {xY, XY} 
la probabilidad pedida es p(A|B) y aplicando la definición anterior
p(B) = 0,5; A Ç B = {xY}; p(A ÇB) = 0,25; p(A|B) = 0,25/0,5 = 0,5

Si sabemos que es varón, el espacio muestral ha cambiado, ahora es B. Por lo tanto se puede calcular p(A|B) aplicando la definición clásica de probabilidad al nuevo espacio muestral 
p(A|B) = 1/2 = 0,5 

Ejemplo 4:

Se sabe que el 50% de la población fuma y que el 10% fuma y es hipertensa. ¿Cuál es la probabilidad de que un fumador sea hipertenso?

A = {ser hipertenso} B = {ser fumador} 
A Ç B = {ser hipertenso y fumador} 
p(A|B) = 0,10/0,50 = 0,20

Obsérvese que los coeficientes falso-positivo y falso-negativo de las pruebas diagnósticas son probabilidades condicionadas.

La fórmula anterior se puede poner p(A Ç B) = p(B) p(A|B) = p(A) p(B|A) 
llamada regla de la multiplicación, que se puede generalizar a más sucesos 
p(A1 Ç A2 Ç A3) = p((A1 Ç A2) Ç A3) = p(A1 Ç A2) p(A3|A1 Ç A2) = p(A1) p(A2|A1) p(A3|A1 Ç A2)

En general p(A1 Ç A2 Ç A3 ...) = p(A1) p(A2|A1) p(A3|A1 Ç A2) ... 
llamado principio de las probabilidades compuestas y especialmente útil para aquellas situaciones en que las probabilidades condicionadas son más fáciles de obtener que las probabilidades de las intersecciones.

Ejemplo 5:

Se sabe por estudios previos que el 0,1% de la población tiene problemas vasculares. Un estudio sobre individuos con problemas vasculares revela que el 20% de ellos son placas de ateroma. Si el 10% de los individuos con placas de ateroma están expuestos a muerte súbita por desprendimiento de trombos ¿qué probabilidad tiene un individuo cualquiera de estar expuesto a muerte súbita por desprendimiento de trombos de una placa de ateroma?

A1 = {problemas vasculares}; A2 = {placas de ateroma}; A3 = {expuesto a muerte súbita por ....} 
p(A1) = 0,001; p(A2|A1) = 0,20; p(A3|A1 Ç A2) = 0,1 
p(A1 Ç A2 Ç A3) = 0,001 x 0,20 x 0,1 = 0,000002 

Ejemplo 6:

Una urna contiene 10 bolas, de las cuales 3 son rojas, 5 verdes y 2 azules. Se extraen al azar 3 bolas. Calcular la probabilidad de que la primera sea azul, y las otras dos verdes.

Definimos A1 = {la 1ª bola es azul}; A2 = {la 2ª bola es verde}; A3 = {la 3ª bola es verde} 
p(A1) = 2/10 aplicando la definición clásica de probabilidad, puesto que hay 10 bolas y 2 son verdes. 
p(A2|A1) = 5/9; si la primera bola extraída es azul, en la urna quedan 9 bolas, 5 de ellas verdes. 
p(A3|A1 Ç A2) = 4/8; si la primera bola extraída es azul y la segunda verde en la urna quedan 8 bolas, 4 de ellas verdes. 
p(A1 Ç A2 Ç A3) = 2/10 x 5/9 x 4/8 = 1/18

Sucesos independientes

Dos sucesos son independientes si y sólo si p(A Ç B) = p(A) p(B).
Si dos sucesos son independientes

Descripción: http://www.hrc.es/bioest/Prob_ec3.gif

y del mismo modo p(B|A) = p(B).

Esta propiedad coincide más con la idea intuitiva de independencia y algunos textos la dan como definición. Hay que notar, sin embargo, que ambas definiciones no son estrictamente equivalentes.


Ejemplo 7:

Para un hijo de una mujer portadora de Duchenne, el sexo y la enfermedad ¿son independientes?

Según vimos en el Ejemplo 3 el espacio muestral es W = {xX, xY, XX, XY} 
Definimos los sucesos A = {varón} = {xY, XY}; B = {enfermo} = {xY} 
A Ç B = {xY} 
por lo tanto p(A) = 0,5; p(B) = 0,25; p(A Ç B) = 0,25 ¹ p(A) p(B) NO son independientes.

Teorema de Bayes

Si los sucesos Ai son una partición y B un suceso tal que p(B) ¹ 0

Descripción: http://www.hrc.es/bioest/Prob_ec5.gif

Demostración

Aplicaciones

Diagnóstico médico (en general clasificaciones no biunívocas): El diagnóstico consiste en establecer la enfermedad de un paciente, a partir de una serie de síntomas. Pero los síntomas y las enfermedades no están ligados de un modo biunívoco.

Llamemos Ei al conjunto de enfermedades 
E1: tuberculosis pulmonar; E2 :cáncer de pulmón; E3: bronquitis obstructiva; etc. 
y Si a los síntomas y síndromes asociados con las mismas. 
S1: tos; S2: estado febril; S3: hemotisis; etc. 
La información accesible en los libros de patología, o en un archivo de historias clínicas es del tipo.
Para E1: algunos (digamos el 20%) tienen hemotisis; muchos (80%) tienen tos; etc. 
y lo mismo para las demás enfermedades.

En términos de probabilidad condicionada, esta información es 
p(S3|E1) = 0,2; p(S1|E1) = 0,8 etc. 
para diagnosticar la tuberculosis se ha de evaluar, para los síntomas que presenta el paciente p(E1|Si) para lo que se puede usar el teorema de Bayes si las enfermedades forman una partición (son mutuamente excluyentes y se consideran todas las enfermedades compatibles con el síntoma) y se conocen sus prevalencias.

Nótese que un mismo conjunto de síntomas podría dar lugar a un diagnóstico diferente en poblaciones en las que las prevalencias fueran diferentes.

Pruebas diagnósticas: Supóngase una prueba diagnóstica, por ejemplo nivel de glucosa en sangre, en ayunas, para diagnosticar la diabetes. Se considera que la prueba es positiva si se encuentra un nivel por encima de un cierto valor, digamos 120 mg/l.

Para evaluar la prueba, (habrá que hacerlo para distintos valores de corte) se somete a la misma a una serie de individuos diabéticos diagnosticados por otro procedimiento (el patrón de oro o "gold standar") y a una serie de individuos no diabéticos. Los resultados se pueden representar en una tabla de doble entrada

 

 

Patrón de oro

 

 

 

NE

E

 

Prueba

-

a

b

r

+

c

d

s

 

 

t

u

 

 

Si la prueba fuera perfecta b=c=0, desgraciadamente nunca ocurre. Se denomina coeficiente falso-positivo (CFP) al cociente c/t, y es una estimación de la probabilidad condicionada p(+|NE), se denominacoeficiente falso-negativo (CFN) al cociente b/u, y es una estimación de la probabilidad condicionada p(-|E). Estos dos coeficientes cuantifican los dos errores que la prueba puede cometer y caracterizan a la misma. Simétricamente, los coeficientes que cuantifican los aciertos son lasensibilidad, p(+|E), y la especificidad p(-|NE).

Cuando la prueba se usa con fines diagnósticos (o de "screening") interesa calcular p(E|+) y/o p(NE|-). 

Como E y NE son una partición, usando el Teorema de Bayes

Descripción: http://www.hrc.es/bioest/Prob_ec7.gif

y

Descripción: http://www.hrc.es/bioest/Prob_ec8.gif

Nótese que ambas dependen de la prevalencia de la enfermedad: una prueba diagnóstica que funciona muy bien en la clínica Mayo, puede ser inútil en el Hospital Ramón y Cajal. 

Ejemplo 9:

una prueba diagnóstica para la diabetes tiene un CFP de 4% y un CFN del 5%. Si la prevalencia de la diabetes en la población donde se usa es del 7% ¿cuál es la probabilidad de que sea diabético un individuo en el que la prueba dé positiva? y ¿de que no lo sea uno en el que dé negativo?

p(+|NE) = 0,04 Þ p(-|NE) = 0,96 
p(-|E) = 0,05 Þ p(+|E) = 0,95 
p(E) = 0,07 Þ p(NE) = 0,93

Descripción: http://www.hrc.es/bioest/Prob_ec9.gif

y

Descripción: http://www.hrc.es/bioest/Prob_ec10.gif

Pruebas en serie: Cuando se aplican pruebas en serie, para cada prueba p(E) y p(NE), serán la p(E|+) y p(NE|+) de la prueba anterior (si dio positiva) o p(E|-) y p(NE|-) si dio negativa.

Problemas de probabilidad propuestos:

1º Una mujer es hija de una portadora de la enfermedad de Duchenne. Dicha mujer tiene tres hijos sanos. Calcular la probabilidad de que ella sea portadora de la enfermedad.

Solución

2º Una prueba diagnóstica para el cáncer uterino tiene un coeficiente falso-positivo de 0.05 y falso-negativo de 0.10. Una mujer con una probabilidad pre-prueba de padecer la enfermedad de 0.15 tiene un resultado negativo con la misma. Calcular la probabilidad de que no esté enferma.