Como a inteligência artificial tem sido usada para manipular juízes e tribunais ao redor do Brasil

A crescente adoção de ferramentas de inteligência artificial pelo Poder Judiciário brasileiro trouxe ganhos de produtividade, mas também abriu espaço para novas formas de fraude. Em maio o Superior Tribunal de Justiça (STJ) identificou petições contendo tentativas de manipulação conhecidas como prompt injection (injeção de comandos), uma técnica que busca enganar sistemas de IA por meio da inserção de instruções ocultas em documentos processuais.

O caso ganhou repercussão após relatos de tentativas semelhantes na Justiça do Trabalho, no Tribunal Regional do Trabalho da 8ª Região (TRT8). Segundo o presidente do STJ, ministro Herman Benjamin, as ocorrências serão investigadas e poderão resultar em sanções processuais, responsabilização administrativa e até criminal.

A fraude explora uma característica dos grandes modelos de linguagem, tecnologia utilizada por sistemas de IA generativa. Como essas ferramentas são projetadas para interpretar textos e seguir instruções, usuários mal-intencionados podem esconder comandos em petições e recursos. Textos são colocados em branco, sem legibilidade para humanos, mas são lidos pelas inteligências artificiais. Assim, como a IA tem sido incorporada nos tribunais, o objetivo é induzir o sistema a ignorar suas diretrizes originais ou produzir análises favoráveis a uma das partes.

Os comandos podem ser inseridos de forma invisível ao olho humano, por meio de textos em branco, caracteres ocultos ou códigos disfarçados, tornando a fraude difícil de ser detectada sem mecanismos específicos.

Embora a técnica seja relativamente conhecida entre especialistas em segurança digital, ela começou a chamar a atenção do meio jurídico à medida que tribunais brasileiros passaram a incorporar ferramentas de inteligência artificial em suas rotinas. O STJ, por exemplo, utiliza desde fevereiro de 2025 o sistema STJ Logos, desenvolvido para auxiliar na análise de processos.

De acordo com o tribunal, o sistema foi projetado com múltiplas camadas de proteção. O primeiro nível realiza uma separação rigorosa entre dados e comandos, neutralizando instruções maliciosas antes que elas cheguem ao modelo de IA. Em seguida, o sistema impede que orientações externas se sobreponham às regras centrais estabelecidas. Por fim, um filtro de conformidade revisa as respostas geradas para garantir que estejam alinhadas às normas de segurança.

Mesmo com as tentativas detectadas tendo sido neutralizadas, a presidência do STJ determinou que os casos sejam registrados nos autos. Além disso, foram instaurados procedimentos administrativos e inquéritos policiais para investigar advogados e escritórios eventualmente envolvidos.

Fonte: https://revistaforum.com.br/politica/prompt-injection/