¿Qué son las variables? Parte 1
En la vida médica cotidiana trabajamos con datos referidos a variables. Una variable es una condición o característica determinada sobre la que obtendremos información. El dato es el valor que cada variable asumirá en un individuo determinado. Por ejemplo, la variable es frecuencia cardíaca; el dato es 78 latidos/minuto. La variable es nacionalidad; los datos podrán ser argentino, chileno, uruguayo, etc.
Podemos clasificar a las variables según la naturaleza de los datos en variables cualitativas y variables cuantitativas.
Las variables cualitativas expresan calidades, o condiciones. Pueden ser nominales u ordinales. Una variable nominal asume valores que representan categorías sin importar el orden en que se las enumere. Por ejemplo: raza, nacionalidad, color de ojos, género, etc. Cuando la variable nominal asume sólo 2 resultados posibles (sí-no, presente-ausente) se llama dicotómica. Por ejemplo: antecedente de IAM, tratado con aspirina, etc. Una variable ordinal asume valores que representan categorías en las que el orden es importante, implica estratificación, una condición o pronóstico progresivamente peores. Por ejemplo: clase funcional NYHA, Killip y Kimball, etc.
Tanto las variables nominales como las ordinales pueden expresarse como números, pero estos no funcionan como tales, son “nombres” o categorías, y por lo tanto no pasibles de operaciones aritméticas. Por ejemplo, se puede definir a priori que para la variable nacionalidad “1” significa argentino,“2” chileno, “3” uruguayo y “4” otras; 1, 2, 3 y 4 son “etiquetas” o nombres; podrían ser reemplazadas por A, C, U y O (iniciales de las nacionalidades correspondientes) sin cambiar el sentido de lo que se reporta. De igual modo, la clase funcional 2 de la NYHA no es 2 veces más grave que la CF1, ni un Killip 1 implica 3 veces menos severidad que un Killip 3. Por eso está mal presentar un promedio de Killip o CF para una población.
Al resumir la información de variables nominales y las ordinales se emplean porcentajes: el cociente entre el número de observaciones con una característica determinada sobre el total de las observaciones, multiplicado por 100. Ejemplos: si en un estudio se recaban datos de 120 pacientes, y 80 son hombres, (80/120) x100, el 66,6% son hombres. Los porcentajes se presentan a su vez en tablas de contingencia.
Las variables cualitativas se pueden graficar en gráficos de barras o tortas.
Las variables cuantitativas asumen valores numéricos, y los números valen como tales: reportan cantidad. Por lo tanto se puede realizar con ellos operaciones aritméticas. Las variables cuantitativas pueden ser discretas o continuas. Las variables discretas asumen sólo valores enteros, por ejemplo número de hijos (no se pueden tener 1,5 hijos). Las variables continuas pueden tener decimales, y siempre entre 2 valores puede haber un tercero. Por ejemplo: altura, peso, hematocrito, colesterol, etc.
Que habitualmente con algunas variables usemos sólo valores enteros no significa que sean discretas. Por ejemplo, al hablar de fracción de eyección usamos valores enteros (decimos FE 32, 33, etc.) aunque la variable admite decimales, que no usamos por no parecer clínicamente importante. Con la mayoría de las determinaciones de laboratorio ocurre lo mismo: la glucemia se expresa en mg/dl, y no usamos decimales; pero sin duda entre 126 y 127 mg/dl son posibles valores de 126,5 o de 126, 78 mg/dl.
Las variables discretas, al presentarse como promedio de varias observaciones lógicamente tendrán decimales, pero eso no las hace continuas. Por ejemplo, si el número total de hijos de 10 mujeres es 18, diremos que en promedio tienen 1,8 hijos; pero ese es un promedio de varias observaciones: una mujer no puede tener 1,8 hijos, tiene 1 o 2; de allí que la variable sea discreta.
La información de las variables cuantitativas se presenta con medidas de posición y dispersión. A ellas nos dedicaremos en la próxima entrega.
Dr. Jorge Thierer