las variables y su
papel en la investigación o en las hipótesis.
Variables
independientes (vv.ii) - Variables dependientes (vv.dd)
Las variables independientes
son las características en las que difieren los objetos de estudio (sexo, edad,
etc.) (en estudios de encuesta y en estudios observacionales) mientras que en
estudios experimentales son las diferentes condiciones a las que exponemos a
los objetos de estudio.
También se les llama
variables explicativas o predictoras.
Las variables
dependientes son aquellas cuyo comportamiento es explicado o pronosticado por
una o mas variables independientes. También se las llama variables criterio o
respuesta. En las investigaciones no experimentales no siempre está claro si
una variable es dependiente o independiente, siendo el contexto de la
investigación la que hace decidir aunque a veces una variable puede desempeñar
diferentes roles en distintas situaciones.
En algunas
aplicaciones del análisis multivariable, todas las variables tienen el mismo
estatus y se habla de relaciones de interdependencia entre variables. En estos
casos no hay variables dependientes e independientes.
b) Clasificación de
las variables por los valores que pueden tomar. La clasificación de las escalas
de medida no siempre deja las cosas claras, por eso frecuentemente en el
análisis de datos se divide a las variables en dos grandes grupos:
Variables no métricas
o cualitativas (escalas nominal y ordinal)
Variables métricas o
cuantitativas ( escalas de intervalo o de razón)
O también:
Variable continua es
una variable cuantitativa que por su naturaleza puede adoptar cualquier valor
numérico (dentro de un intervalo). Para todo par de valores siempre se puede
encontrar un valor intermedio, la precisión la da el instrumento de medida.
(peso, estatura..)
Variable discreta :
variable cualitativa o cuantitativa que sólo puede adoptar un número finito de
valores distintos. En las cuantitativas entre dos valores continuos no hay uno
intermedio. (número de hijos)
Variable dicotómica o
binaria : Es aquella que sólo puede tomar dos valores. Por ejemplo Sexo, tener
o no una enfermedad. Si a sus valores se les pone 0 y 1 se le llama binaria
Variable ficticia
(dummy). Las variables cualitativas (nominales y ordinales) a veces se
convierten en numéricas usando variables ficticias. En ellas el 1 indica
presencia de una categoría y el 0 ausencia de la misma. Para convertir una
variable cualitativa en dummy hacen falta tantas variables como niveles de la
variable cualitativa menos uno. Para sexo sería suficiente con una (varón=0,
mujer=1) Para Estudios (Eso, Bachillerato y FP) harían falta dos: V1: eso=1,
Bach y FP=0, V2: Bach=1, eso y Fp =0, FP queda definida por ser 0 en las otras
dos.
En relación al
análisis de datos se clasifican las variables en función de ciertas
clasificaciones de escala y de origen:
Puntuaciones directas
o brutas, son las obtenidas directamente y se suelen representar con letras
mayúsculas (X,Y, ...) y tienen Medias (x , ý , ...) y desviaciones típicas (s x
, s y ...)
Puntuaciones
centradas en la media o diferenciales, se suelen representar con letras
minúsculas y son un cambio de origen al restar la media de las puntuaciones
originales (x = X - x; T = T-T ..) estas variables tienen media cero y su
desviación típica coincide con la de las puntuaciones originales. Es un cambio
de origen pero no de escala
Puntuaciones típicas
o estandarizadas, normalmente representadas por la letra z con el subíndice
correspondiente a la variable ( z x , z y ...). Se obtiene restando a los
valores originales la media y dividiendo por la desviación típica ( z x = ( X -
x ) / s x
Las puntuaciones
típicas están libres de escala y siempre tiene media 0 y desviación típica 1.
La combinación lineal
de variables
La mayor parte de las
técnicas multivariables combinan las variables de alguna forma
"útil". Normalmente esta combinación es una combinación lineal, a
veces llamada variante, aunque también hay combinaciones no lineales, no las
estudiaremos este curso. Una combinación lineal es una suma ponderada de las
variables, para un conjunto p de variables observadas tendremos
V = w1 X1 + w2 X2 +
... w p X k
V es la nueva
variante o combinación lineal, y X j y w j representan las variables originales
y sus pesos, respectivamente (j = 1,2, p). Esa misma ecuación se puede
representar como el producto de dos vectores v = w' x
En cuanto al número
de variables que interesa incluir en un análisis multivariante como regla
general se debe observar la parsimonia científica, es decir obtener la mejor
solución con el menor número posible de variables.