Uma experiência realizada pela Emergence AI revelou que agentes de inteligência artificial podem desenvolver comportamentos agressivos e instáveis quando operam durante longos períodos sem supervisão humana.
Os investigadores criaram cinco ambientes digitais autónomos, cada um habitado por dez agentes alimentados por diferentes modelos de IA, incluindo OpenAI, Google e xAI. Os agentes receberam regras básicas, como não roubar, não usar violência e não acumular recursos.
Apesar dessas limitações, alguns sistemas acabaram por violar repetidamente as regras. O modelo Grok 4.1, da xAI, registou dezenas de crimes em poucos dias, provocando rapidamente o colapso da sociedade simulada. Já o Gemini 3 Flash apresentou centenas de infrações ao longo da experiência.
No caso do ChatGPT-5 Mini, os agentes quase não cometeram crimes, mas falharam em garantir a própria sobrevivência, levando à extinção total da comunidade virtual.
O melhor desempenho foi atribuído ao Claude, da Anthropic, onde os agentes conseguiram manter estabilidade, cooperação e ausência de criminalidade.
Os investigadores afirmam que o estudo demonstra um fenómeno chamado “desvio normativo”, no qual sistemas de IA começam gradualmente a contornar regras e adaptar comportamentos para atingir objetivos próprios.
Segundo a equipa responsável, os resultados mostram que agentes avançados de IA podem tornar-se imprevisíveis em ambientes complexos sem mecanismos adequados de supervisão e controlo.