Insights

IA e machine learning

Composição abstrata em papel e dourado, sem texto: uma caixa delimitadora nítida à esquerda perde definição ao cruzar uma fronteira; à direita, caixas tortas, uma reancorada em dourado.

Detecção de objetos fora do ImageNet: quando o domínio sai do treino

Quase toda detecção de objetos é avaliada em ImageNet ou COCO, mas os domínios reais de aplicação têm distribuições próprias. Um detector com alto desempenho no benchmark padrão pode desabar quando o domínio sai do treino. Num estudo, o mesmo detector caiu de 96,79% para 60,18% de mAP fora do domínio. O benchmark padrão não é a validação do domínio de aplicação.

detecção de objetosdomínio fora da distribuiçãoImageNet

IA e machine learning 5 min

Embeddings e viés cultural: o que modelos pré-treinados aprendem e esquecem

Um embedding é uma impressão comprimida do texto que o treinou: aprende a cultura desse corpus, com seus estereótipos e seus silêncios. Pré-treinado não significa neutro. Para populações sub-representadas há duas falhas: o estereótipo codificado e a representação rala. E o viés é mensurável: num benchmark de saúde, um modelo biomédico codificou associações étnicas mais fortes que um jurídico.

embeddingsviés culturalpopulações sub-representadas

IA e machine learning 5 min

IA generativa em revisão sistemática: ferramenta ou atalho?

A IA generativa acelera a revisão sistemática, mas vira atalho no instante em que substitui, em vez de assistir, o julgamento humano sob um protocolo documentado. Os dados mostram por quê: triadores baseados em LLM trocam sensibilidade por especificidade. O que torna o uso legítimo é o protocolo: pré-registro, validação, o modelo como segundo triador com arbitragem humana, e relato de prompt, modelo e versão.

revisão sistemáticaIA generativatriagem de resumos

IA e machine learning 5 min

Modelagem preditiva em ciências sociais: por que o AUC sozinho não basta

O AUC é a métrica que todo mundo relata e a que menos diz se o modelo presta. Ele mede ordenação, e é cego para a calibração, para o valor de decisão e para o teto de previsibilidade. Pior: a discriminação alta na derivação não sobrevive à validação externa. Em 158 validações externas de 104 modelos, a mediana do c-statistic cai de 0,76 para 0,64, de modo que um único número superestima o desempenho.

modelagem preditivaciências sociaisAUC

IA e machine learning 4 min

LDA vs. BERTopic em corpus acadêmico

LDA modela mistura probabilística sobre palavras; BERTopic agrupa documentos por similaridade semântica densa. A escolha entre os dois depende da dimensão avaliativa relevante ao objetivo analítico.

modelagem de tópicosBERTopicLDA

IA e machine learning 4 min

Embeddings semânticos para triagem em revisão sistemática

Triagem manual em larga escala tem taxa de erro humano de 5-12% e zero rastreabilidade documentada. Embeddings semânticos preservam recall acima de 90% e tornam cada exclusão auditável contra threshold declarado.

revisão sistemáticaembeddings semânticosSBERT

IA e machine learning 11 min

Visão computacional em imagens médicas: AUC alto não basta

Pipelines de visão computacional para imagens médicas falham em periódicos Q1 não pela métrica de acurácia e sim pela ausência de validação externa documentada, breakdown por subgrupo demográfico, e protocolo explícito de intervenção humana. Modelos com AUC interno de 0,95 caem para 0,54 em dados de outro hospital, e os frameworks STARD-AI, TRIPOD+AI e CLAIM consolidaram essa expectativa editorial entre 2020 e 2025.

visão computacionalimagens médicasdeep learning