LIME — Glossário Aria Research

Definição estendida

LIME, sigla de local interpretable model-agnostic explanations, é um método para explicar uma previsão individual de qualquer modelo de caixa-preta. A ideia, proposta por Ribeiro e colaboradores (2016), é local e agnóstica ao modelo: para explicar por que o modelo classificou um caso específico, o LIME gera muitas pequenas perturbações em torno desse caso, observa como a previsão muda e ajusta um modelo simples e interpretável, em geral uma regressão linear, válido apenas na vizinhança daquele ponto. As perturbações são ponderadas pela proximidade ao caso original, de modo que o substituto linear capte o comportamento local do modelo, não o global. O resultado é um conjunto de pesos que indicam quais atributos empurraram a previsão em cada direção, para aquele caso. Guidotti e colaboradores (2018), na revisão dos métodos de explicação, situam o LIME entre os explicadores locais agnósticos, ao lado do SHAP, e o distinguem das abordagens que abrem a estrutura interna do modelo.

Quando se aplica

O LIME se aplica quando se quer entender uma decisão específica de um modelo cuja lógica interna é opaca, sem trocar o modelo por um mais simples. Aplica-se a qualquer arquitetura, de florestas a redes profundas, justamente por ser agnóstico. Adadi e Berrada (2018), no panorama da IA explicável, registram o LIME entre as ferramentas mais usadas para auditar previsões individuais em contextos de alto risco, como crédito, saúde e justiça. Aplica-se bem a dados tabulares, texto e imagem, com representações interpretáveis próprias para cada tipo: palavras presentes, em texto, ou regiões da imagem. Aplica-se ao diálogo com partes não técnicas, oferecendo uma explicação local intuitiva. E aplica-se como complemento ao SHAP, quando se quer uma segunda leitura da mesma previsão.

Quando NÃO se aplica

O LIME não se aplica como explicação global: ele descreve o comportamento do modelo na vizinhança de um caso, não o modelo inteiro, e extrapolar uma explicação local para uma regra geral induz a erro. Não se aplica quando a estabilidade é exigida sem cuidado: por depender de perturbações aleatórias, o LIME pode produzir explicações diferentes para o mesmo caso em execuções distintas, fragilidade bem documentada. Não se aplica sem atenção à definição de vizinhança e ao núcleo de ponderação, que mudam o resultado de forma significativa. Não se aplica como prova de causalidade: os pesos indicam associação local na fronteira de decisão do modelo, não efeito causal no mundo. E não se aplica quando o substituto linear não consegue aproximar uma fronteira muito curva localmente, caso em que a explicação perde fidelidade.

Aplicações por área

Crédito e risco: explicação de decisões individuais de aprovação ou recusa, exigida por auditoria e por regulação.
Saúde: justificativa de uma predição clínica caso a caso, como apoio à confiança do profissional na ferramenta.
Processamento de linguagem: destaque das palavras que mais pesaram em uma classificação de texto.
Visão computacional: identificação das regiões de uma imagem que sustentaram a previsão do modelo.

Armadilhas comuns

A primeira armadilha é generalizar uma explicação local: o LIME fala de um caso, e tomar seus pesos como regra global do modelo distorce a leitura. A segunda é ignorar a instabilidade: sem fixar semente e repetir, a mesma previsão pode receber explicações divergentes. A terceira é não revisar a vizinhança e o núcleo de ponderação, parâmetros que alteram o resultado. A quarta é ler os pesos como causalidade, quando indicam apenas associação na fronteira local do modelo. A quinta é confiar em uma única explicação local sem confrontá-la com outra ferramenta, como o SHAP, perdendo a chance de detectar quando o substituto linear falhou em aproximar o comportamento real.