DADOS E ESTATÍSTICA · 23 verbetes
Dados e Estatística.
Verbetes sobre métodos estatísticos clássicos e técnicas multivariadas usadas em pesquisa empírica: testes de hipóteses, regressão, análise fatorial, modelagem de equações estruturais e métricas associadas.
Alfa de Cronbach Coeficiente clássico de consistência interna para escalas e instrumentos, proposto por Cronbach em 1951. Apesar do uso massivo em psicometria, hoje é criticado por pressupostos restritivos — alternativas como ômega de McDonald são preferidas.
Estatística Análise bibliométrica Mapeamento quantitativo da produção científica de um campo via metadados de artigos: redes de coautoria, co-citação, evolução temporal, fronts emergentes. Hoje usa Scopus, Web of Science e ferramentas como VOSviewer e Bibliometrix.
Estatística Análise de cluster Família de métodos não-supervisionados que agrupa observações por similaridade. Algoritmos clássicos: k-means (MacQueen, 1967), agrupamento hierárquico, DBSCAN. Validação por silhouette (Rousseeuw, 1987), estabilidade e interpretabilidade.
Estatística Análise de redes Família de métodos para estudar relações entre entidades representadas como nós e arestas. Métricas centrais: centralidade (grau, betweenness, eigenvector), densidade, modularidade, detecção de comunidades. Wasserman e Faust (1994) é a referência clássica.
Estatística Análise de sobrevivência Família de métodos para tempo até evento (morte, recidiva, falha) com tratamento explícito de dados censurados. Estimador Kaplan-Meier (1958) para função de sobrevivência; modelo de Cox (1972) para regressão de hazard ratios.
Estatística Análise fatorial confirmatória (CFA) Técnica de modelagem que testa se uma estrutura fatorial hipotetizada *a priori* se ajusta aos dados observados. Padrão psicométrico para validar instrumentos de medida com escalas e itens; estabelecida por Jöreskog em 1969 e implementada hoje em lavaan, Mplus e AMOS.
Estatística Análise fatorial exploratória (EFA) Técnica multivariada de redução de dados que identifica fatores latentes subjacentes a um conjunto de variáveis observadas, sem hipótese a priori sobre a estrutura. Tipicamente precede CFA na validação de instrumentos de mensuração.
Estatística ANOVA Análise de variância (Analysis of Variance): técnica estatística clássica para comparar médias entre três ou mais grupos. Estabelecida por Fisher em 1925 e fundação dos delineamentos experimentais em ciências biomédicas, agrárias e comportamentais.
Estatística Bootstrap Família de métodos de reamostragem com reposição que estima distribuição amostral de um estimador a partir de uma única amostra. Proposto por Efron (1979). Permite IC e teste de hipótese sem suposição paramétrica de normalidade.
Estatística Dados ausentes e imputação múltipla Tratamento de valores faltantes em dados de pesquisa. Mecanismos: MCAR, MAR, MNAR. Imputação múltipla (Rubin, 1987) gera m datasets completos via amostragem da distribuição posterior, combinando estimativas via regras de Rubin para inferência válida.
Estatística Intervalo de confiança Faixa de valores construída a partir de dados amostrais que, em uso repetido, contém o parâmetro populacional verdadeiro com probabilidade igual ao nível de confiança nominal (tipicamente 95%). Formalizado por Neyman em 1937.
Estatística MANOVA Análise multivariada de variância: extensão da ANOVA para múltiplas variáveis dependentes simultaneamente. Testa se médias diferem entre grupos considerando estrutura de correlação entre desfechos. Estatísticas de teste: Wilks Lambda, Pillai, Hotelling-Lawley, Roy.
Estatística Mediação e moderação Mediação: variável M explica COMO X afeta Y (mecanismo causal). Moderação: variável W modifica QUANDO ou PARA QUEM o efeito de X em Y ocorre (interação). Distinção formalizada por Baron e Kenny (1986); abordagem moderna via Hayes (2018).
Estatística Modelagem de equações estruturais (SEM) Família de técnicas multivariadas que combina análise fatorial e regressão múltipla para testar redes de relações entre variáveis latentes e observadas. Padrão em ciências sociais, comportamentais e da saúde para validar modelos teóricos complexos.
Estatística Modelos mistos (GLMM) Modelos generalizados que combinam efeitos fixos (parâmetros populacionais) e efeitos aleatórios (variação entre grupos/sujeitos). Apropriados para dados aninhados, longitudinais ou agrupados. Implementação canônica em R via lme4 (Bates et al., 2015).
Estatística P-valor Probabilidade de obter, sob a hipótese nula, valor de estatística de teste tão extremo ou mais extremo que o observado. Métrica central no teste de hipóteses frequentista. ASA emitiu declaração formal em 2016 alertando contra interpretações equivocadas.
Estatística Pareamento por escore de propensão Método de inferência causal em estudos observacionais que pareia tratados e controles com base no escore de propensão — probabilidade estimada de receber tratamento dadas covariáveis. Rosenbaum e Rubin (1983) formalizaram. Reduz viés de confundimento observável.
Estatística Poder estatístico Probabilidade de um teste estatístico rejeitar corretamente a hipótese nula quando ela é falsa, ou seja, $1 - \beta$. Padrão mínimo recomendado: 0,80. Cohen (1988) formalizou cálculo de tamanho amostral baseado em poder. Pré-registro hoje exige análise a priori.
Estatística Regressão linear Modelo estatístico que estima a relação linear entre uma variável dependente e uma ou mais independentes. Fundação metodológica de boa parte da estatística aplicada e ponto de entrada didático para modelos preditivos mais complexos.
Estatística Regressão logística Modelo estatístico para variável dependente categórica que estima probabilidade de pertencer a uma categoria como função logística de preditores. Variantes: binária, multinomial e ordinal. Cox (1958) formalizou para resposta binária.
Estatística Séries temporais Família de métodos estatísticos para dados ordenados no tempo, modelando tendência, sazonalidade, autocorrelação e ruído. Decomposição clássica X = T + S + R; modelos paramétricos canônicos ARIMA (Box e Jenkins, 1976). Forecasting é objetivo central.
Estatística Tamanho de efeito Medida quantitativa da magnitude de um efeito ou diferença observada, independente do tamanho da amostra. Inclui famílias d (Cohen), r (correlação) e razão de chances. Componente exigido em reporting moderno por DORA, ASA e estilos APA/AMA.
Estatística Validade convergente e discriminante Critérios de validade de instrumento: convergente (itens do mesmo construto correlacionam fortemente) e discriminante (itens de construtos distintos correlacionam fracamente). Operacionalização clássica via AVE de Fornell e Larcker (1981) e HTMT de Henseler et al. (2015).
Estatística