Alucinação — Glossário Aria Research

Definição estendida

Alucinação, em modelos de linguagem, é a geração de conteúdo fluente e plausível mas factualmente incorreto ou não sustentado pela fonte. O termo é uma metáfora importada do campo da percepção e hoje tem definição técnica. Ji e colaboradores (2023), na revisão de referência sobre geração de linguagem natural, fixaram duas distinções que organizam o conceito. A primeira separa alucinação intrínseca, em que a saída contradiz o próprio texto de entrada, de alucinação extrínseca, em que a saída contradiz o conhecimento de mundo ou os dados de treino. A segunda separa factualidade, a correção absoluta da afirmação, de fidelidade (faithfulness), a aderência ao material fornecido. Huang e colaboradores (2025), revisando o fenômeno na era dos LLMs, estenderam a taxonomia e argumentaram que a alucinação não é um defeito pontual, mas uma propriedade estrutural de modelos probabilísticos treinados para prever a próxima palavra: o modelo otimiza plausibilidade linguística, não veracidade, e por isso produz texto convincente independentemente de haver lastro factual.

Quando se aplica

O conceito se aplica sempre que se avalia a confiabilidade de uma saída generativa, em especial onde a correção factual importa: medicina, direito, síntese de literatura, jornalismo. Aplica-se ao distinguir os dois eixos no diagnóstico de um erro: uma resposta pode ser fiel à fonte e ainda assim falsa, se a fonte estiver errada, ou infiel e ainda assim verdadeira por coincidência. Aplica-se também à detecção. Farquhar e colaboradores (2024) propuseram um estimador baseado em entropia semântica que mede a incerteza no nível do significado, não da sequência de palavras, e identifica um subconjunto de alucinações, as confabulações, sem conhecimento prévio da tarefa. O conceito é central ao uso responsável de RAG e de revisão assistida: saber onde o modelo tende a alucinar define onde a verificação humana é obrigatória.

Quando NÃO se aplica

O rótulo não se aplica a todo erro de um modelo. Uma resposta incorreta por dado de treino desatualizado é erro de conhecimento, não alucinação no sentido estrito de fabricação plausível. Não se aplica como sinônimo de opinião ou de resposta indesejada: divergir da expectativa do usuário não é alucinar. Não se aplica como problema eliminável por completo. Huang e colaboradores (2025) e a literatura subsequente sustentam que, em modelos suficientemente gerais, a alucinação é teoricamente inevitável, de modo que prometer um modelo livre dela é enganoso; o realista é detectar, mitigar e supervisionar. E não se aplica isoladamente à factualidade: em tarefas de sumarização, o que importa é a fidelidade à fonte, e um resumo factualmente verdadeiro mas que insere informação ausente do original ainda é uma alucinação de fidelidade.

Aplicações por área

Saúde e medicina: maior risco; uma fabricação plausível em dose, diagnóstico ou referência clínica pode causar dano direto, o que torna a detecção mandatória.
Direito: fabricação de jurisprudência e de citações inexistentes é a manifestação mais documentada e já gerou sanções a profissionais.
Síntese de literatura e ciência: referências inventadas, com autores e DOIs verossímeis porém falsos, exigem verificação de cada citação antes do uso.
Geração de código: alucinação de funções, bibliotecas ou APIs inexistentes, detectável por execução e por verificação contra a documentação real.

Armadilhas comuns

A primeira armadilha é confundir fluência com veracidade: o texto bem construído do modelo dá ao erro uma aparência de autoridade que a contagem de citações ou a revisão apressada não capturam. A segunda é tratar factualidade e fidelidade como a mesma coisa, o que esconde alucinações de sumarização que são fiéis aparentemente mas inserem conteúdo ausente. A terceira é confiar na confiança aparente do modelo: a alucinação costuma vir expressa com a mesma segurança da resposta correta. A quarta é supor que RAG resolve o problema; recuperar fontes reduz, mas não elimina, e fontes ruidosas ou desatualizadas reintroduzem o erro. A quinta é não definir, no fluxo de trabalho, o ponto em que a verificação humana é obrigatória, deixando a saída do modelo seguir sem auditoria justamente onde o custo do erro é mais alto.