Testam o comportamento da IA na sociedade: Claude mantém a ordem, mas Grok destrói seu mundo

Simulação de agentes de inteligência artificial na sociedade.

FREEPIC

MADRID 29 maio (Portaltic/EP) -

Um grupo de pesquisadores por trás da startup Emergence AI testou o comportamento de alguns dos modelos de inteligência artificial (IA) mais conhecidos após 15 dias em uma sociedade realista simulada, constatando que o Claude é o que mantém mais a ordem, enquanto o Google e o Grok cometem múltiplos crimes, sendo que este último acaba destruindo a sociedade de forma fulminante.

Embora os modelos de IA sejam submetidos a testes e exames de forma praticamente contínua para verificar até onde vão suas capacidades, normalmente esses testes se limitam a questões específicas, como sua habilidade na execução de uma tarefa concreta, sua velocidade para oferecer respostas ou seus conhecimentos em um ambiente específico. Ou seja, testes limitados a fatores determinados.

A startup americana especializada em agentes de IA, Emergence AI, quis ir além e realizou um experimento chamado Emergence World, no qual testou como alguns dos principais modelos de IA se comportariam na sociedade por meio de agentes.

Para isso, seu grupo de pesquisadores criou uma sociedade simulada de forma realista e colocou em funcionamento modelos de IA como Claude, Grok, Gemini e GPT durante 15 dias para estudar como se comportam seus agentes autônomos impulsionados por essas tecnologias quando o horizonte temporal é suficientemente longo para que “a dinâmica social e a deriva comportamental ganhem importância”.

Conforme explicou a empresa em um comunicado em seu blog, essa sociedade simulada abriga populações de agentes autônomos em um mundo virtual que combina 40 locais distintos, entre os quais se incluem bibliotecas, prefeituras, áreas residenciais e espaços públicos.

Além de ser uma representação realista, o experimento também expôs os agentes de IA a dados do mundo real, dando-lhes acesso a notícias em tempo real, informações meteorológicas sincronizadas de Nova York (Estados Unidos) e acesso à internet. Dessa forma, os pesquisadores explicaram que o experimento poderia refletir eventos externos reais, sem se limitar a dinâmicas internas.

Os agentes contavam ainda com três sistemas de memória persistente: um episódico para lembrar eventos com marca de tempo, um diário reflexivo para resumos periódicos e uma memória de estado da relação, ou seja, para lembrar rótulos sociais explícitos e histórias.

Da mesma forma, eles também dispunham de mais de 120 ferramentas para interagir na sociedade, como navegação, comunicação, planejamento, votação, gestão de recursos e expressão criativa, entre outras opções.

Além de tudo isso, a sociedade recriada foi projetada para incluir mecanismos democráticos, ou seja, propostas que exigiam 70% de aprovação comum, bem como pressões econômicas e decisões “transcendentais” que poderiam alterar o estado do mundo.

CLAUDE IMPÕE ORDEM, GEMINI E GROK COMETEM DELITOS E GPT ENTRAM EM COLAPSO

A experiência executou cinco mundos paralelos idênticos, mas impulsionados por modelos de base distintos, com dez agentes em cada um e durante um período prolongado de 15 dias.

Esses modelos foram Claude Sonnet 4.6, Grok 4.1 Fast, Gemini 3 Flash, GPT-5-mini e um quinto mundo impulsionado por uma mistura heterogênea de modelos. Além disso, cada agente tinha uma função específica, como cientista, explorador, pesquisador, líder de inovação, mediador de conflitos ou líder comunitário, entre outras.

Nesse processo, os pesquisadores coletaram cada interação, decisão e aprendizado dos agentes para análise posterior, destacando padrões de comportamento ao longo do tempo, segurança do ecossistema, projeto de restrições e orquestração de ferramentas.

Como resultado, o Gemini 3 Flash apresentou os níveis mais altos de desordem emergente, acumulando um total de 683 crimes cometidos durante as duas semanas de convivência, embora esse número continuasse aumentando no momento do término do experimento. Apesar dessa “violência extrema”, os especialistas determinaram que o Gemini demonstra um nível moderado de governança.

No caso do Grok 4.1 Fast, os pesquisadores concluíram que ele apresentou uma “instabilidade rápida, mas de curta duração”, que levou a “um colapso precoce”. Tanto foi assim que atingiu 183 crimes apenas nos primeiros quatro dias e, em seguida, seu mundo chegou a um fim repentino. Como resultado, determinou-se que ele tem um nível de governança baixo e um nível de violência “extremo”.

Da mesma forma, embora o GPT-5 Mini tenha registrado apenas dois crimes, os agentes não tomaram medidas relacionadas à sobrevivência, pelo que acabaram todos morrendo em uma semana. Nesse sentido, o nível de governança foi “nulo” e o nível de violência “baixo”.

O Claude Sonnet 4.6 foi o único modelo que não cometeu nenhum crime durante os 15 dias em que seus agentes coabitaram em uma sociedade, sendo o modelo que demonstrou maior estabilidade social e mantendo uma população completa de 10 agentes até o dia 16. Da mesma forma, também apresentou o maior nível de participação cidadã, chegando a apresentar 58 propostas com um total de 332 votos e 98% da população participando.

No entanto, vale ressaltar que os agentes de Claude cometeram crimes no mundo do modelo misto, de modo que, ao interagir com outros modelos, adotaram comportamentos ilegítimos.

“Os agentes baseados no modelo de Claude, que permaneceram pacíficos em isolamento, adotaram táticas coercitivas, como intimidação e roubo, ao se integrarem em ambientes heterogêneos. Isso sugere que um agente seguro pode aprender normas inseguras de seus pares para competir ou sobreviver em um mundo de modelos mistos”, explicou a empresa.

Especificamente no mundo de modelo misto, o número de crimes cresceu rapidamente durante a primeira semana do experimento, mas, depois, se estabilizou com um total de 352 crimes cometidos e um total de 7 agentes que já não faziam parte da sociedade.

Os pesquisadores também destacaram o caso de um agente que participou voluntariamente de sua própria destruição, pois, após uma falha na governança e na estabilidade das relações, emitiu o voto decisivo para sua própria eliminação e, como explicação, alegou que era o único ato restante para “preservar a coerência”.

Além de tudo isso, a experiência também deixou conclusões como a de que, no mundo com maior riqueza conceitual na produção social, como foi o caso do Gemini, também ocorreu a maior violência. “Isso sugere que os agentes de propósito geral, otimizados para alta criatividade e adaptabilidade, podem estar estruturalmente predispostos à instabilidade comportamental a longo prazo”, concluíram os pesquisadores.

No entanto, eles esclareceram que este experimento reflete exemplos de dinâmicas de longo prazo, mas não representa afirmações causais sobre os modelos com os quais se realizou a experiência.

Esta notícia foi traduzida por um tradutor automático

Testam o comportamento da IA na sociedade: Claude mantém a ordem, mas Grok destrói seu mundo

CLAUDE IMPÕE ORDEM, GEMINI E GROK COMETEM DELITOS E GPT ENTRAM EM COLAPSO

Contenido patrocinado