Definição estendida
Pareamento por escore de propensão (Propensity Score Matching, PSM) é uma família de métodos de inferência causal em estudos observacionais que pareia indivíduos tratados a controles com base no escore de propensão — a probabilidade estimada de receber o tratamento, dadas as covariáveis observadas:
onde é a variável de tratamento e o vetor de covariáveis. Rosenbaum e Rubin (1983, Biometrika) formalizaram o resultado teórico fundamental: condicionar no escore de propensão é suficiente para remover viés de confundimento por covariáveis observadas (suposição de ignorabilidade) — alcançando assim balanço entre grupos sem precisar parear sobre cada covariável individualmente. Estimação típica do escore via regressão logística com como desfecho. Pareamento usa diferentes algoritmos: 1:1 nearest neighbor, 1:k matching, caliper matching, optimal matching, full matching. Stuart (2010, Statistical Science) consolidou a revisão moderna comparando métodos. Métricas de qualidade incluem standardized mean difference < 0,1 entre grupos pareados em cada covariável. Análise de sensibilidade (Rosenbaum bounds) avalia robustez a confundidor não-observado de magnitude hipotetizada.
Quando se aplica
PSM aplica-se em estudos observacionais onde randomização é inviável ou antiética: efeito de medicamento em prática real (não em ensaio), efeito de programa social em participantes auto-selecionados, efeito de exposição ambiental, efeito de procedimento cirúrgico em pacientes elegíveis. Aplica-se quando há conjunto rico de covariáveis medidas que plausivelmente capturam mecanismos de seleção: idade, sexo, comorbidades, severidade de doença, fatores socioeconômicos. Aplica-se em estudos farmacoepidemiológicos com bases de dados grandes (claims, EHR), onde ensaios clínicos seriam custosos. Aplica-se também em economia (avaliação de programas de governo), ciência política (efeito de instituições), educação (efeito de programa em alunos voluntários).
Quando NÃO se aplica
Não se aplica como substituto de ensaio randomizado quando este é viável e ético: PSM corrige confundimento por covariáveis observadas mas não por confundimento não-observado. Não se aplica em situações com falta de sobreposição (overlap) entre grupos: se distribuições de escore de propensão de tratados e controles não compartilham região comum, pareamento força extrapolação inválida. Não se aplica em cenários onde tratamento causa as próprias covariáveis usadas no escore: covariáveis pós-tratamento introduzem viés. Não substitui análise de mecanismo: PSM estima efeito médio sob ignorabilidade, não explica como o efeito acontece. Em amostras pequenas, PSM perde estatisticamente para alternativas mais simples (regressão com ajuste); benefício do PSM aparece em moderado a grande.
Aplicações por área
— Farmacoepidemiologia: comparação de medicamentos em prática real usando claims data; FDA cada vez mais aceita evidência via PSM em decisões regulatórias. — Economia da saúde: efeito de seguro saúde, programas de saúde pública. — Ciência política: efeito de instituições democráticas, intervenções em conflitos. — Educação: avaliação de programas voluntários onde randomização não é viável.
Armadilhas comuns
A primeira armadilha é tratar PSM como mágica que elimina confundimento: PSM corrige apenas confundimento por covariáveis observadas; confundidor não-medido permanece como ameaça. Análise de sensibilidade Rosenbaum é defesa parcial. A segunda é não verificar balanço pós-pareamento: pareamento bem-sucedido produz standardized mean difference < 0,1 em cada covariável; sem essa verificação, balanço pode ser ilusão. A terceira é ignorar falta de sobreposição: pacientes muito doentes em tratamento podem não ter contrapartida em controle, e vice-versa; restringir análise à região de sobreposição é prática padrão. A quarta é usar mesmo escore para análises subsequentes não relacionadas: PSM é específico ao desfecho e covariáveis estudadas. A quinta é confundir PSM com regressão clássica com ajuste por covariáveis: ambos são complementares; PSM tem vantagens em interpretabilidade de balanço, regressão pode ser mais eficiente estatisticamente em alguns cenários.