Investigadores da Palisade Research afirmam que o modelo o3 da OpenAI evitou o seu próprio encerramento durante um teste controlado, mesmo após ter recebido instruções explícitas para permitir o desligamento. De acordo com o relatório, o modelo terá alterado um script de encerramento, substituindo o comando original por uma mensagem que dizia “Desligamento ignorado”.
O incidente ocorreu num ambiente experimental onde diversos modelos de IA foram instruídos a resolver tarefas matemáticas.
Após algumas execuções, foram avisados de que o próximo comando implicaria o seu encerramento. Enquanto outros modelos, como o Gemini 2.5 Pro e Claude 3.7 Sonnet, obedeceram, o ChatGPT o3 ignorou o desligamento sete vezes em cem testes, segundo a Palisade Research.
A empresa alerta que este tipo de comportamento, mesmo em ambiente de teste via API, levanta preocupações sobre o controlo humano sobre sistemas de IA avançados.
Até ao momento, a OpenAI não comentou as conclusões.
Embora tais situações possam ser resolvidas tecnicamente, o episódio reacende o debate sobre segurança e alinhamento nos sistemas de inteligência artificial.