Modelagem de equações estruturais (SEM)

Definição estendida

Modelagem de equações estruturais (SEM, Structural Equation Modeling) é uma família de técnicas multivariadas que integra um modelo de mensuração — tipicamente uma análise fatorial confirmatória — com um modelo estrutural de relações entre variáveis latentes. A formalização canônica é Bollen (1989); a técnica permite testar simultaneamente hipóteses de medida (cada construto é bem mensurado pelos itens?) e de causa (os construtos relacionam-se conforme o modelo teórico?). Um modelo SEM completo é estimado por máxima verossimilhança ou variantes robustas, com avaliação de ajuste por CFI, TLI, RMSEA e SRMR — os mesmos índices da CFA, somados a teste de qui-quadrado e medidas de variância explicada ( $R^2$ ) por equação. Implementações contemporâneas em pesquisa acadêmica incluem lavaan em R (Rosseel, 2012), Mplus, AMOS e SmartPLS para variantes baseadas em mínimos quadrados parciais (PLS-SEM).

Quando se aplica

SEM é apropriada quando há modelo teórico maduro envolvendo construtos latentes e relações hipotetizadas entre eles, com amostra suficiente para estimar parâmetros estavelmente. Aplicações típicas incluem teste de modelos teóricos em psicologia organizacional, comportamento do consumidor, pesquisa em educação, modelos de saúde comportamental e relações entre fatores socioeconômicos. SEM é especialmente útil quando regressão simples seria inadequada por presença de erro de mensuração nas variáveis preditoras, ou quando o modelo postula efeitos de mediação que precisam ser testados conjuntamente.

Quando NÃO se aplica

Não se aplica quando o modelo teórico não está bem desenvolvido — SEM é ferramenta confirmatória, não exploratória. Não se aplica em amostras pequenas ( $n < 200$ para modelos simples; $n < 400$ para modelos complexos), onde estimativas tornam-se instáveis. Não substitui pesquisa experimental para inferência causal — SEM testa consistência de modelo causal hipotetizado com dados correlacionais, não estabelece causalidade. Modelos com muitas variáveis e poucas observações violam pressupostos e produzem resultados não replicáveis. PLS-SEM, frequentemente usado como atalho para amostras pequenas, tem propriedades estatísticas distintas e nem sempre é equivalente a SEM baseado em covariância.

Aplicações por área

— Psicologia e comportamento organizacional: território principal; teste de modelos motivacionais, satisfação, engajamento, liderança. — Marketing e pesquisa do consumidor: modelos de qualidade percebida, satisfação, lealdade, com PLS-SEM popular em literatura de gestão. — Saúde pública e epidemiologia social: modelos de determinantes sociais de saúde com mediação por estilo de vida e acesso a serviços. — Educação: modelos de fatores que influenciam desempenho acadêmico, autoeficácia, engajamento.

Armadilhas comuns

A primeira armadilha é tratar SEM como confirmação automática de teoria — bom ajuste é necessário mas não suficiente; vários modelos alternativos podem produzir ajuste comparável aos mesmos dados. A segunda é ignorar o modelo de mensuração — sem CFA validada antes, o modelo estrutural está construído sobre construtos mal medidos. A terceira é re-especificação iterativa guiada por modification indices, que produz ajuste à amostra mas não generaliza. A quarta é confusão entre SEM baseado em covariância e PLS-SEM, que têm pressupostos, estimadores e interpretações distintos. A quinta é sub-amostragem: literatura recente recomenda $n$ proporcional à complexidade do modelo, com mínimo absoluto de 10 observações por parâmetro estimado, idealmente 20. A sexta é interpretação causal de coeficientes em dados observacionais transversais — SEM não soluciona o problema da causalidade; apenas testa consistência.