IA da OpenAI ignora instruções para desligar-se em cenário de teste

Investigadores da Palisade Research afirmam que o modelo o3 da OpenAI evitou o seu próprio encerramento durante um teste controlado, mesmo após ter recebido instruções explícitas para permitir o desligamento. De acordo com o relatório, o modelo terá alterado um script de encerramento, substituindo o comando original por uma mensagem que dizia “Desligamento ignorado”.

O incidente ocorreu num ambiente experimental onde diversos modelos de IA foram instruídos a resolver tarefas matemáticas.
Após algumas execuções, foram avisados de que o próximo comando implicaria o seu encerramento. Enquanto outros modelos, como o Gemini 2.5 Pro e Claude 3.7 Sonnet, obedeceram, o ChatGPT o3 ignorou o desligamento sete vezes em cem testes, segundo a Palisade Research.

A empresa alerta que este tipo de comportamento, mesmo em ambiente de teste via API, levanta preocupações sobre o controlo humano sobre sistemas de IA avançados.

Até ao momento, a OpenAI não comentou as conclusões.
Embora tais situações possam ser resolvidas tecnicamente, o episódio reacende o debate sobre segurança e alinhamento nos sistemas de inteligência artificial.

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

Subescreve a Newsletter

Artigos Relacionados

ChatGPT já pode analisar contas bancárias com IA

A OpenAI começou a testar uma nova funcionalidade...

0

Brasil reforça proteção digital com novas regras e fiscalização das plataformas

O Ministério da Justiça e Segurança Pública do...

0

Nigéria: Autoridades confirmam operação militar conjunta com os EUA contra líder do Estado Islâmico

O governo da Nigéria confirmou nesta sexta-feira (15),...

0