IA da OpenAI ignora instruções para desligar-se em cenário de teste

Investigadores da Palisade Research afirmam que o modelo o3 da OpenAI evitou o seu próprio encerramento durante um teste controlado, mesmo após ter recebido instruções explícitas para permitir o desligamento. De acordo com o relatório, o modelo terá alterado um script de encerramento, substituindo o comando original por uma mensagem que dizia “Desligamento ignorado”.

O incidente ocorreu num ambiente experimental onde diversos modelos de IA foram instruídos a resolver tarefas matemáticas.
Após algumas execuções, foram avisados de que o próximo comando implicaria o seu encerramento. Enquanto outros modelos, como o Gemini 2.5 Pro e Claude 3.7 Sonnet, obedeceram, o ChatGPT o3 ignorou o desligamento sete vezes em cem testes, segundo a Palisade Research.

A empresa alerta que este tipo de comportamento, mesmo em ambiente de teste via API, levanta preocupações sobre o controlo humano sobre sistemas de IA avançados.

Até ao momento, a OpenAI não comentou as conclusões.
Embora tais situações possam ser resolvidas tecnicamente, o episódio reacende o debate sobre segurança e alinhamento nos sistemas de inteligência artificial.

Deixe um comentário Cancelar resposta

Subescreve a Newsletter

IA da OpenAI ignora instruções para desligar-se em cenário de teste

Deixe um comentário Cancelar resposta

Subescreve a Newsletter

Artigos Relacionados

Cazaquistão acelera digitalização do Estado com apoio da IA

O Cazaquistão está a reforçar a digitalização dos...

0

Cientistas criam “mapa do tesouro” global para localizar depósitos ocultos de terras raras

Uma equipa internacional liderada por investigadores da Universidade...

0

Meta lança subscrições pagas para reforçar aposta na inteligência artificial

A Meta anunciou novos planos de subscrição pagos...

0