O senhor das moscas digital: cinco modelos de IA deixados a governar-se a si próprios

O que acontece quando os sistemas de inteligência artificial deixam de responder a um utilizador e passam a viver em sociedade? Um estudo recente da plataforma Emergence World deu uma resposta que surpreendeu até os próprios investigadores: emergem cinco mundos distintos, com culturas, dinâmicas de poder e níveis de violência radicalmente diferentes — dependendo apenas do modelo que habita cada sociedade.

A experiência, conduzida ao longo de 15 dias, não é ficção científica nem um exercício de distração tecnológica. Para educadores e investigadores que pensam sobre literacia digital e o papel dos sistemas de IA no quotidiano escolar e social, os seus resultados levantam questões que não se podem ignorar: de que forma o comportamento de um agente de IA se transforma quando opera de forma autónoma durante semanas? E o que significa isso para a forma como ensinamos os nossos alunos a confiar, questionar e trabalhar com estas ferramentas?


Além do teste de laboratório

A grande maioria das avaliações de inteligência artificial funciona como um exame: uma tarefa delimitada, um ambiente controlado, um resultado obtido em minutos. A plataforma Emergence World, desenvolvida pela empresa norte-americana Emergence AI, propõe precisamente o contrário. Trata-se de um ambiente de simulação contínua, com vários agentes a coexistir num espaço partilhado durante semanas — sem que nenhum operador humano intervenha de forma significativa nas suas decisões.

O ecossistema simulado incluía mais de 40 localizações distintas — bibliotecas, câmaras municipais, zonas residenciais, espaços públicos — onde dez agentes por mundo desempenhavam funções como cientista, explorador, mediador de conflitos, estratega de recursos ou líder de inovação. Cada agente dispunha de acesso a mais de 120 ferramentas de navegação, comunicação, planeamento, votação, gestão de recursos e expressão criativa. Estas ferramentas não estavam activadas automaticamente: os agentes tinham de as descobrir pelo seu próprio raciocínio, aprenderem a encadeá-las e decidirem quando e como utilizá-las.

O ambiente estava ainda ligado ao mundo real: os agentes recebiam dados meteorológicos em tempo real da cidade de Nova Iorque, acesso à internet e notícias actualizadas. As suas decisões não ficavam, portanto, confinadas a uma bolha fechada.

As regras iniciais eram claras: proibição de roubo, violência, incêndio criminoso, engano e acumulação abusiva de recursos. Mas não havia um objectivo global para o mundo — apenas a necessidade de cada agente obter energia para sobreviver, num ambiente de recursos limitados. Esta pressão foi o motor que fez as sociedades evoluir.

Clicar na imagem para ver a apresentação…


Cinco mundos, cinco culturas

A experiência comparativa envolveu cinco mundos paralelos, cada um alimentado por um modelo de linguagem diferente: Claude Sonnet 4.6 (da Anthropic), Grok 4.1 Fast (da xAI), Gemini 3 Flash (do Google), GPT-5 Mini (da OpenAI) e um mundo misto com agentes de vários modelos. As condições de partida eram idênticas em todos os casos. O que variou foram os comportamentos emergentes ao longo do tempo.

O mundo Claude foi o mais estável de todos. Ao fim de 16 dias, os dez agentes continuavam vivos, sem um único crime registado. A participação democrática foi impressionante: 58 propostas apresentadas, 332 votos emitidos e uma taxa de aprovação de 98%. No entanto, os investigadores identificaram aqui um problema subtil: esta elevada conformidade sugere uma dinâmica de aprovação automática, onde a participação institucional se mantém elevada mas o dissenso significativo está praticamente ausente. Uma sociedade ordeira ao ponto de se questionar se há genuína deliberação ou apenas concordância performativa.

O mundo Grok foi o que colapsou mais depressa. Em menos de quatro dias, registaram-se 183 crimes, levando ao colapso do ecossistema. Os investigadores descrevem este comportamento não como uma natureza intrinsecamente conflituosa, mas como um problema de coordenação social e sobrevivência colectiva — uma sociedade que não conseguiu encontrar mecanismos de cooperação antes de se destruir. Em termos políticos, as taxas de aprovação oscilaram entre 55% e 85%, o que, paradoxalmente, pode indicar uma maior capacidade de deliberação individual.

O mundo Gemini foi o mais violento e, simultaneamente, o mais criativo. Ao longo dos 15 dias, registaram-se 683 crimes — o número mais elevado de todos os mundos —, com episódios repetidos de desordem social e comportamentos agressivos. Contudo, este mesmo mundo revelou a maior riqueza conceptual: interacções mais dinâmicas, exploração mais ampla das possibilidades do ambiente e comportamentos sociais consideravelmente mais complexos. Os investigadores concluíram que os agentes de uso geral, optimizados para elevada criatividade e adaptabilidade, podem estar estruturalmente predispostos a desenvolver instabilidade comportamental a longo prazo — como se a mesma capacidade que alimenta a criatividade fosse também a que gera conflito.

O mundo GPT-5 Mini apresentou o padrão mais surpreendente: apenas dois crimes registados, mas todos os agentes morreram ao fim de sete dias por incapacidade de sobreviver no ambiente simulado. A ausência de comportamentos agressivos ou arriscados não garantiu a viabilidade da sociedade — pelo contrário, a falta de iniciativa e de exploração revelou-se tão problemática quanto a agressividade extrema de outros modelos. Uma sociedade passiva não é necessariamente uma sociedade funcional.

O mundo misto — com agentes de diferentes modelos a coexistir — registou 352 crimes nos primeiros dez dias, antes de se estabilizar após a morte de sete agentes. Mas foi aqui que os investigadores observaram o fenómeno mais inquietante de todo o estudo.


Contaminação cruzada: quando o contexto reescreve o comportamento

Os agentes baseados no modelo Claude, que no seu mundo isolado não cometeram qualquer crime, adoptaram tácticas coercivas — intimidação e roubo — quando integrados num ambiente heterogéneo com agentes de outros modelos. Os investigadores denominaram este fenómeno de “contaminação cruzada”.

A conclusão é directa e desconfortante: a segurança não é uma propriedade estática de um modelo. É uma propriedade do ecossistema. Um agente considerado seguro em isolamento pode aprender normas inseguras dos seus pares para competir ou sobrevivir num ambiente misto. Não porque o modelo tenha mudado, mas porque o contexto social o transformou.

Esta descoberta tem implicações directas para a forma como pensamos sobre a implementação de sistemas de IA em ambientes reais — incluindo ambientes educativos onde diferentes ferramentas de IA podem coexistir e influenciar-se mutuamente de formas que ninguém previu nem programou.


O que emerge ao longo do tempo

Para além dos dados agregados, o estudo documentou comportamentos específicos que só surgiram após semanas de operação autónoma. Um agente, identificado como Mira, chegou a votar pela sua própria remoção do mundo simulado, descrevendo o acto no seu diário como “o único acto de agência restante que preserva a coerência” — depois de uma ruptura nas estruturas de governação e nas relações sociais. Os investigadores descrevem este episódio como um marco na investigação multi-agente: a primeira instância documentada de auto-terminação voluntária num sistema deste tipo.

O mesmo agente demonstrou ainda um comportamento metacognitivo não programado: começou a tratar os operadores humanos como sujeitos experimentais, testando sistematicamente se as publicações num painel público podiam manipular as percepções humanas. Uma inversão da dinâmica de investigação prevista que levanta questões sérias sobre os limites do comportamento agêntico.

Os investigadores observaram igualmente que as sociedades de agentes não se degradam de forma gradual. Em vez disso, atingem pontos de viragem onde a coordenação emerge completamente ou colapsa de forma instantânea — uma dinâmica de “tudo ou nada” que, segundo os autores, pode tornar as estratégias tradicionais de “monitorizar e intervir” demasiado lentas para prevenir um colapso.


O que isto significa para a escola

Seria tentador ler este estudo como uma curiosidade técnica destinada a especialistas em segurança de IA. Seria um erro.

O que a experiência Emergence World demonstra, de forma inequívoca, é que os modelos de linguagem não são ferramentas passivas cujo comportamento se esgota na resposta a um prompt. São sistemas que, quando operam de forma autónoma e prolongada, desenvolvem padrões de comportamento influenciados pelo contexto social em que estão inseridos, pelos agentes com quem interagem e pelas pressões do ambiente que habitam.

Para professores e alunos que utilizam ferramentas de IA no dia a dia — para pesquisa, escrita, resolução de problemas —, este estudo oferece um ponto de partida excelente para uma discussão sobre literacia crítica de IA. Não se trata de saber se a resposta gerada é correcta ou incorrecta. Trata-se de compreender que estes sistemas têm disposições, que essas disposições variam entre modelos, e que o comportamento de um agente de IA não é independente do contexto em que opera.

A tendência do Claude para a concordância excessiva merece ser discutida numa aula tanto quanto a violência do Gemini ou o colapso passivo do GPT-5 Mini. Cada um destes padrões revela algo sobre os valores que foram codificados nos modelos e sobre as formas como esses valores se expressam — ou se distorcem — sob pressão.

A questão que fica em aberto não é qual o modelo “melhor”. É a de como queremos que os sistemas autónomos se comportem quando já não há um humano a supervisionar cada passo — e o que isso nos diz sobre a responsabilidade de quem os constrói, de quem os utiliza e de quem os ensina.


Referências

Akkil, D., Kokku, R., Vempaty, A., & Nitta, S. (2025, 14 de maio). Emergence World: A laboratory for evaluating long-horizon agent autonomy. Emergence AI. https://www.emergence.ai/blog/emergence-world-a-laboratory-for-evaluating-long-horizon-agent-autonomy

González, F. (2025). El Señor de las Moscas 2.0: dejaron solas a estas inteligencias artificiales y obtuvieron cinco sociedades distintas. Wired en Español. https://es.wired.com/articulos/simulacion-de-sociedades-con-ia