Análisis Factorial
El análisis factorial es un método de análisis multivariante que busca explicar un conjunto extenso de variables observadas mediante un número reducido de variables hipotéticas llamadas factores. Se parte de una población con un conjunto de variables observables, y se intenta encontrar varios factores comunes a dichas variables que revelen la estructura de lo observado. En resumen, un análisis factorial identifica un número pequeño de factores que representan la relación entre un conjunto de variables intercorrelacionadas, minimizando la pérdida de información.
Propiedades de los Factores
Los factores resumen los patrones que reproducen la matriz de correlación observada. Deben cumplir al menos tres propiedades:
- Mantener la información de las variables iniciales.
- Ser linealmente independientes.
- Tener importancia en la explicación de la varianza total.
Tipos de Análisis Factorial
Existen dos tipos principales de análisis factorial:
- Exploratorio: Describe y resume datos agrupando variables correlacionadas. Los factores no se conocen a priori, sino que se determinan mediante el análisis.
- Confirmatorio: Se utiliza para probar una teoría sobre un proceso latente. Requiere variables cuidadosamente elegidas para revelar el factor subyacente, por lo que se usa en etapas avanzadas de la investigación.
Supuestos del Análisis Factorial
El principal supuesto es la existencia de correlaciones. Para ello, se valoran:
Matriz de Correlaciones
Para que sea adecuada, la mayoría de las correlaciones deben ser superiores a 0,30. Un determinante bajo indica altas correlaciones, lo que la hace adecuada para el análisis.
Prueba KMO (Kaiser-Meyer-Olkin)
Determina la adecuación de la muestra para el análisis factorial:
- > 0.90: Excelente
- > 0.80: Meritorio
- > 0.70: Mediano
- > 0.60: Mediocre
- > 0.50: Bajo
- < 0.50: Inaceptable
Test de Esferidad de Bartlett
Comprueba la hipótesis de que la matriz de componentes rotados es una matriz identidad. Se basa en el cálculo de un valor Chi-Cuadrado. Si es alto (significación < 0.05), se rechaza la hipótesis nula de no interrelación entre variables.
Correlaciones Anti-Imagen
Es la inversa de la suma de las correlaciones de cada variable con las demás. Equivale al negativo del coeficiente de correlación parcial. Muchos coeficientes altos en la matriz deberían hacer reconsiderar el análisis.
Extracción de Factores
Se determina el número de factores a retener mediante cinco criterios:
- Varianza común explicada: El conjunto de factores extraídos debería explicar el 70% u 80% de la varianza total.
- Criterio de raíz latente: Se retienen factores con autovalor superior a 1.
- Criterio de contraste de caída: Se busca el punto de inflexión en el gráfico de sedimentación de autovalores, donde la línea empieza a “sedimentar”. Se toman los factores anteriores a ese punto.
- Heterogeneidad de la muestra
- Criterio establecido a priori
Interpretación de Factores
Se evalúan:
- Saturaciones factoriales: Correlación entre variables originales y factores extraídos. Cargas altas (+- 0.70), significativas (+-0.50) y no significativas (-0.50). Un gráfico de componentes ayuda a la interpretación.
- Rotación de factores: La rotación ortogonal (Varimax, Quartimax, Equamax) se usa cuando los factores no están correlacionados. La rotación oblicua (oblimin, promax) facilita el ajuste de las variables a los factores.
- Valoración de las comunalidades: Proporción de varianza común de cada variable. Variables con baja comunalidad tienen bajas correlaciones con las demás y aportan menos varianza a la solución factorial. Se puede eliminar variables, usar otra rotación o método de extracción.
Puntuación factorial: Valor de cada caso en cada factor extraído, expresado en puntuaciones Z (media 0, desviación típica 1).
Validación del Análisis Factorial
Se debe valorar:
- Generalización: Aplicabilidad de los resultados a otras muestras.
- Influencia de los casos: Impacto de casos específicos en los resultados.
- Replicación: Resultados similares en otras investigaciones.
- Estabilidad: Estructura factorial estable entre análisis.
- Impacto de los outliers: Influencia de casos extremos.