Definição estendida
Tamanho de efeito (effect size) é qualquer medida quantitativa da magnitude de um fenômeno — diferença entre médias, força de associação, proporção de variância explicada — que seja, idealmente, independente do tamanho amostral. Contraste com -valor, que confunde magnitude e tamanho amostral: amostra grande com efeito trivial pode produzir minúsculo, enquanto amostra pequena com efeito real pode produzir alto. A família mais comum em pesquisa biomédica e comportamental é o de Cohen para diferença entre médias:
onde é o desvio padrão combinado dos dois grupos. Cohen (1988) propôs convenções de magnitude — pequeno (), médio (), grande () — válidas para ciências comportamentais mas não universais. Outras famílias incluem (correlação de Pearson, ou correlação parcial), e (proporção de variância em ANOVA), razão de chances e risco relativo (epidemiologia), e padronizado em regressão. Reporting moderno (DORA, ASA, APA, AMA, CONSORT) exige tamanho de efeito ao lado de -valor.
Quando se aplica
Tamanho de efeito é exigido sempre que resultado quantitativo é reportado em manuscrito acadêmico moderno. É essencial em meta-análise (combinação de estudos requer métrica comparável de magnitude), em cálculos de poder estatístico a priori (planejamento de amostra requer estimativa de efeito esperado), e em interpretação clínica (efeito estatisticamente significativo pode ser clinicamente irrelevante). É também ferramenta crítica em comunicação para audiências não-técnicas — medida em unidades padronizadas é mais interpretável que coeficiente bruto sem contexto.
Quando NÃO se aplica
Não se aplica como única medida quando contexto requer também intervalo de confiança e -valor — os três se complementam, não se substituem. Convenções de magnitude (pequeno/médio/grande) não são universais: o que é “grande” em psicologia social pode ser “pequeno” em epidemiologia clínica, e o que é trivial em economia pode ser substantivo em ecologia. Para variáveis com unidades naturais interpretáveis (mortalidade, custo em moeda, dias), a métrica original pode ser mais informativa que o tamanho de efeito padronizado. Em desenhos puramente exploratórios ou descritivos, sem hipótese formal, tamanho de efeito perde parte do significado interpretativo.
Aplicações por área
— Saúde e biomédicas: ensaios clínicos com NNT (número necessário a tratar), razão de chances, redução de risco absoluto/relativo. — Psicologia e ciências comportamentais: território natural do de Cohen e do ; reporting padrão em APA. — Educação: intervenções pedagógicas medidas em desvios-padrão de ganho de aprendizagem (Hattie e similares). — Meta-análises de qualquer área: combinação de estudos requer transformação para métrica de efeito comum.
Armadilhas comuns
A primeira armadilha é confiar em convenções universais de magnitude — pode ser “médio” em ciências comportamentais e “enorme” em ensaio clínico de redução de mortalidade. A segunda é reportar apenas -valor sem tamanho de efeito, prática editorial obsoleta proibida por padrões modernos. A terceira é confundir significância estatística com relevância prática: efeito com produz mas é clinicamente trivial. A quarta é calcular tamanho de efeito a partir de -valor convertido (sem acesso aos dados brutos) sem reportar essa transformação como aproximação. A quinta é tratar tamanhos de efeito como aditivos: meta-análise simples de médias de ignora heterogeneidade entre estudos e produz conclusão potencialmente enganosa.