¿Qué es probabilidad? ¿Qué son las distribuciones de probabilidad?

En la vida cotidiana pensamos habitualmente en términos de probabilidad. ¿Cuál es la probabilidad de que algo suceda? Y como médicos: ¿Cuál es la probabilidad de que un paciente tenga determinada enfermedad o responda a determinado tratamiento? La respuesta a la pregunta tiene que ver con la frecuencia con que ocurre un hecho en particular: la cantidad de veces en que se da determinado resultado sobre la cantidad de veces que un ensayo, determinación o medición se realiza.

Por ejemplo, si tratamos a 40 hipertensos con inhibidores de la enzima convertidora, y 30 logran valores normales de tensión arterial, diremos que la probabilidad de obtener ese resultado es 75%: (30/40) x 100. Si en una población el 20% es mayor de 70 años, la probabilidad de una persona tomada al azar de esa población de ser mayor de 70 años será 20%.

La probabilidad (p) se expresa en números decimales, y la suma total de las probabilidades referidas a determinada condición en una variable es 1. En el ejemplo del tratamiento antihipertensivo citado, la p de lograr éxito es 0,75, y la de no serlo 0,25.

Cada una de las variables (cuantitativas o cualitativas) que vimos en entregas anteriores puede asumir una serie de valores o condiciones. Por ejemplo, la variable cualitativa “estado civil” puede asumir como resultados probables casado, soltero, viudo, divorciado. La variable cuantitativa altura puede asumir como resultado probable 1,20 mts, 1,21 mts, etc., etc. Quiere decir que para cada variable, sea del tipo que sea, hay una determinada distribución de probabilidades de asumir determinados valores o condiciones.

En el caso de las variables cualitativas o cuantitativas discretas el tema que se plantea es la probabilidad de que determinada categoría o condición esté presente o ausente en un número X de observaciones. Por ejemplo, supongamos una población de 50 personas de las cuales 34 tienen ojos marrones, 10 ojos verdes y 6 ojos celestes. La variable “color de ojos” tiene entonces la siguiente distribución de probabilidades: marrones 68% (34/50), verdes 20% (10/50), celestes 12% (6/50). ¿Cuál es la probabilidad de una persona de esta población de tener ojos marrones? Es 68%. ¿Cuál es la probabilidad de una persona de esta población de tener ojos marrones o verdes? Es 88%: 68% + 20%.

Muchas veces la pregunta se refiere a la probabilidad de que una variable dicotómica con probabilidad fija de ocurrencia de un resultado determinado en cada caso, asuma ese resultado en una cantidad de ensayos. Por ejemplo: si un tratamiento en una enfermedad terminal se asocia a una sobrevida al año del 50% y tenemos 10 enfermos con ese tratamiento, ¿cuántos enfermos esperamos que sigan vivos al cabo de 1 año? La respuesta intuitiva es 5 (50% de 10 enfermos). Sin embargo, si bien es cierto que ese es el número más probable, no es menos cierto que siendo la sobrevida de cada enfermo independiente de la del resto, pudiera ser que ninguno sobreviva a 1 año, que sólo lo 1 lo haga, ó 2, ó 3, o hasta los 10! (aunque bajísima, esa probabilidad existe).

La distribución binomial de probabilidades se refiere a este tipo de situación. Nos responde cuál es la probabilidad, en una serie de ensayos independientes, en la que cada ensayo tiene determinada y la misma probabilidad de éxito, de que el mismo sea exitoso desde ninguno hasta todos los ensayos. Esta distribución tiene una media que corresponde al producto de la probabilidad individual por el número de observaciones. En el caso del ejemplo, 0.5 X 10= 5.

Otro ejemplo: supongamos que se realiza en 50 personas medición de la glucemia en ayunas, y se define como diabetes un valor > 126 mg/ml. La prevalencia de diabetes es en la población del 10%. ¿Cuántos esperamos que tengan diabetes? Cinco es el resultado más esperable, pero no el único. Tres, 4, 6 y 7 son también altamente probables, y aún cuando con probabilidad infinitesimal, hasta 50 resultados positivos pueden darse. La suma de todas las probabilidades es 1.

Una distribución diferente es la distribución de Poisson. Se emplea cuando en un gran número de eventos u observaciones queremos conocer la probabilidad de que ocurra algo muy poco frecuente determinada cantidad de veces. Por ejemplo, en una ciudad de 300.000 habitantes con un parque automotor de 60.000 automóviles, la probabilidad diaria de ocurrencia de 1, 2, 3 ó 10 accidentes de tránsito. O en una población de 1.000.000 de personas, la probabilidad de ocurrencia de ACV, o internación por insuficiencia cardíaca. Es una distribución a la que se recurre en estudios de corte epidemiológico.

Dr. Jorge Thierer

 

Deje su comentario