¿Qué es la regresión logística? Parte 1
En la entrega anterior nos referimos a la regresión lineal. Es el método al que recurrimos cuando queremos predecir a partir, de variables basales, el valor de una variable respuesta que es numérica continua. Para poder realizar una regresión lineal es indispensable que, justamente, haya relación lineal entre las variables predictoras y la variable respuesta.
La regresión lineal puede ser entonces el método empleado para predecir, por ejemplo, el valor de la presión arterial, la viscosidad de la sangre, el filtrado glomerular, etc., a partir de variables que, repetimos, deben tener con ellas una relación lineal.
Ahora bien, en nuestra práctica habitual más que predecir el valor de una variable continua nos interesa predecir si ocurrirá o no una variable dicotómica: muerte, internación, recidiva de un tumor, recaída de una enfermedad, reestenosis de un stent, necesidad de nueva revascularización tras una angioplastia o cirugía coronaria. Cada una de estas preguntas se responde con sí o no. Y para cada una de estas variables respuesta dicotómicas existen variables predictoras.
En la literatura médica recurrimos a los conceptos de RR y OR cuando se trata de definir la probabilidad de ocurrencia de una variable dicotómica. Sugerimos fuertemente leer ¿Qué son y qué expresan el riesgo relativo y el odds ratio? y ¿Qué son y qué expresan el riesgo relativo y el odds ratio? Parte 2 para entender cabalmente lo que sigue.
El concepto de probabilidad está emparentado con el de odds. Recordemos que
Odds= probabilidad /1-probabilidad.
Por ejemplo, si para un diabético la probabilidad de tener un IAM en los próximos 20 años es 50%, el odds de tener un IAM es 0,5/1-0,5= 0,5/0,5= 1.
Y si para un no diabético la probabilidad de tener un IAM en los próximos 20 años es 20%, el odds de tener un IAM es 0,2/1-0,2= 0,2/0,8= 0,25.
Esto significa que el cociente de ambos odds, el OR, es 1/0,25 = 4. Ello implica que la probabilidad de un diabético respecto de un o diabético, de tener respecto de no tener un IAM en los siguientes 20 años es 4 veces mayor.
Así nos manejamos al intentar establecer la relación de una variable predictora con una variable respuesta dicotómica: en términos de cuánto aumenta el riesgo de ocurrencia cuando la variable predictora está presente respecto de cuando está ausente.
Ahora bien, si quisiéramos predecir la probabilidad de que ocurra un evento determinado (variable respuesta dicotómica) dada la presencia de una variable predictora y recurriéramos a la regresión lineal nos encontraríamos con que los valores que arroja esa regresión podrían ser menores que 0 o mayores que 1. Y como se recordará, los valores de probabilidad nunca pueden ser menores que 0 (certeza absoluta de que algo no ocurre) o mayores que 1 (certeza absoluta de que ocurre). Esto significa que para predecir la probabilidad de ocurrencia de una variable dicotómica la regresión lineal no sirve. Por eso, cuando se trata de predecir la ocurrencia o no de una variable dicotómica recurrimos a otro tipo de regresión, la regresión logística. ¿De qué se trata? A eso nos referiremos en la próxima entrega.
Dr. Jorge Thierer