Insights

Dados e estatística

Composição abstrata em papel e dourado, sem texto: uma malha regular de células com um bloco de lacunas vazias à direita, algumas reconstruídas em dourado e outras deixadas em aberto.
Dados e estatística 5 min

Missing data não é detalhe técnico: o que pareceristas leem com lupa

Dados faltantes não são uma etapa de limpeza. A escolha entre deletar casos e imputar muda estimativas e erros padrão, e pareceristas Q1 leem essa decisão de perto. O que governa a validade é o mecanismo de ausência assumido, não a porcentagem que faltou. Numa simulação, o erro da imputação foi parecido sob MCAR e MAR, mas disparou sob NMAR, onde a ausência depende do próprio valor que falta.

missing datadados faltantesimputação múltipla
Dados e estatística 7 min

Visualização publicável vs exploratória: dois objetos, duas regras

A visualização exploratória serve ao analista: é rápida, descartável e otimizada para enxergar. A visualização publicável serve ao leitor: é lida uma vez e precisa decodificar sozinha. São objetos diferentes, não dois acabamentos do mesmo gráfico. E o formato de publicação muda a interpretação: um experimento achou gráficos 'better' lidos com mais acurácia (OR 1,55) e clareza (OR 1,91) que os 'normed'.

visualização publicávelvisualização exploratóriapercepção gráfica
Dados e estatística 5 min

SEM em mediação múltipla: quando a regressão linear deixa de responder

A mediação múltipla pergunta por qual mecanismo um efeito acontece, e a quantidade de interesse é o efeito indireto, o produto de caminhos. A regressão linear estima caminhos isolados, não a inferência sobre esse produto nem mediadores simultâneos. A SEM estima tudo junto, acomoda variáveis latentes e cadeias. Para o intervalo, a escolha do bootstrap muda a taxa de falsos positivos de forma mensurável.

mediação múltiplaSEMefeito indireto
Dados e estatística 5 min

Web scraping em pesquisa acadêmica: público não é o mesmo que coletável

Que um dado esteja visível numa página aberta diz respeito ao acesso, não à permissão nem à ética. Web scraping força essa distinção: termos de uso, privacidade e risco de dano traçam a fronteira que a acessibilidade técnica ignora. Uma revisão de 367 estudos com dados públicos do Twitter mediu o problema: a maioria não relatou aprovação ética, e o consentimento informado foi tentado em zero deles.

web scrapingética em pesquisadados públicos
Dados e estatística 4 min

Análise bibliométrica como argumento empírico de tese

Afirmar lacuna por leitura subjetiva é frágil em qualificação. Bibliometria demonstra a lacuna empiricamente e identifica os autores cuja obra o manuscrito não pode ignorar sem perder credibilidade.

bibliometriarevisão de literaturalei de Lotka
Dados e estatística 4 min

Invariância de mensuração em instrumentos traduzidos

Comparações entre grupos exigem evidência empírica de invariância em quatro níveis. Sem isso, a estatística descritiva esconde ruído sistemático que o parecerista metodológico identifica em segundos.

invariância de mensuraçãopsicometriaCFA
Dados e estatística 4 min

Modelagem multinível: quando MLM é obrigatório e quando OLS basta

ICC abaixo de 0,05 permite OLS robusto; entre 0,05 e 0,20 exige cluster-correction ou MLM; acima de 0,20 MLM é obrigatório. A regra que pareceristas metodológicos verificam antes da segunda página.

modelagem multinívelMLMICC
Dados e estatística 11 min

P-valor sozinho não passa: pareceristas Q1 leem na seção de resultados

Periódicos Q1 não baniram o p-valor; baniram o p-valor sozinho. Hoje, pareceristas leem a seção de resultados procurando quatro elementos no pacote mínimo de reporte pós-ASA 2016: tamanho de efeito, intervalo de confiança, justificativa de poder estatístico, e interpretação substantiva separada da inferencial.

estatísticatamanho de efeitop-valor