Análise fatorial exploratória (EFA) — Glossário Aria Research

Definição estendida

Análise fatorial exploratória (EFA, exploratory factor analysis) é uma técnica multivariada de redução de dados que identifica fatores latentes subjacentes a um conjunto de variáveis observadas, sem impor estrutura a priori. O modelo central é:

X = \Lambda F + \epsilon

onde $X$ é a matriz de variáveis observadas, $F$ os fatores latentes, $\Lambda$ a matriz de cargas fatoriais, e $\epsilon$ o erro específico de cada item. Diferente de CFA, na qual o pesquisador especifica antecipadamente quantos fatores existem e quais itens carregam em quais fatores, a EFA descobre essa estrutura a partir dos dados. Decisões metodológicas críticas: método de extração (máxima verossimilhança vs. fatores principais — Fabrigar et al., 1999, recomendam máxima verossimilhança quando suposições de normalidade são razoáveis), número de fatores a reter (Kaiser eigenvalue > 1, scree plot, análise paralela — esta última é o padrão contemporâneo), e método de rotação (varimax quando fatores são esperadamente ortogonais; oblimin/promax quando correlações inter-fatores são plausíveis — comum em ciências sociais). Costello e Osborne (2005) sintetizaram boas práticas e documentaram que a maioria dos estudos publicados usa configurações sub-ótimas (PCA em vez de fatoração, varimax sem justificativa, Kaiser sem análise paralela).

Quando se aplica

EFA é apropriada em estágio exploratório de validação de instrumento — pesquisador desenvolve novo questionário e quer descobrir a estrutura latente que emerge das respostas. Aplica-se em datasets de centenas a milhares de respondentes (mínimo recomendado: $n \geq 5$ por item, idealmente $n \geq 10$ ). Aplica-se em redução dimensional de variáveis correlacionadas em projetos de pesquisa onde o número de variáveis é grande relativamente ao tamanho amostral. Em pipelines de validação rigorosa, EFA é executada em uma metade da amostra (split-half) e CFA na outra metade, garantindo que a estrutura descoberta confirma-se em dados independentes.

Quando NÃO se aplica

Não se aplica quando o pesquisador já tem teoria sólida sobre a estrutura fatorial — nesse caso, CFA é a técnica apropriada. Não se aplica em variáveis categóricas dicotômicas com base em correlação de Pearson — exige correlação tetracórica ou análise fatorial categórica. Não se aplica em amostras pequenas ( $n < 100$ ) com itens muitos: a estrutura encontrada é instável e não replica. Não se aplica como substituto de PCA em redução de dimensão para input de outros modelos: PCA preserva variância total, EFA preserva variância comum (correlacionada). Não se aplica em variáveis ordinais com poucas categorias (3-4) sem ajustes (correlação policórica em SEM com WLSMV).

Aplicações por área

— Psicologia e psicometria: EFA é técnica estrutural na construção de novas escalas; tradição de validação rigorosa exige EFA seguida de CFA em amostra independente. — Pesquisa organizacional: validação de questionários sobre cultura, clima, engagement; estrutura fatorial é input para diagnósticos. — Educação: validação de instrumentos de avaliação; estrutura fatorial dos itens informa qualidade da prova. — Marketing e ciência do consumidor: identificação de dimensões latentes em escalas de atitude e preferência.

Armadilhas comuns

A primeira armadilha é usar PCA (Principal Component Analysis) e chamar de EFA — são técnicas matematicamente diferentes (PCA preserva 100% da variância em componentes; EFA modela apenas variância comum, separando erro específico). A segunda é usar Kaiser eigenvalue > 1 sem complementar com scree plot e análise paralela — Kaiser superestima sistematicamente o número de fatores. A terceira é escolher rotação varimax por default mesmo quando há razão teórica para correlação entre fatores (e.g., dimensões de personalidade) — oblimin é mais apropriado nesse caso. A quarta é interpretar cargas fatoriais menores que 0,40 como evidência substantiva — convenção de Costello & Osborne (2005) sugere 0,32 como mínimo absoluto, com itens com cargas cruzadas (>0,32 em dois fatores) candidatos a remoção. A quinta é confundir EFA com confirmação: descobrir a estrutura na mesma amostra em que a teoria foi testada não é validação — é circular.