Novo modelo do Google DeepMind gera mundos interativos consistentes e de vários minutos para agentes de treinamento

Imagens dos mundos interativos gerados pelo Genie 3

GOOGLE DEEPMIND

MADRID 5 ago. (Portaltic/EP) -

A Google DeepMind apresentou a nova versão de seu modelo Genie, que integra a capacidade de gerar ambientes dinâmicos mais realistas com interação em tempo real durante vários minutos.

Os modelos Genie possibilitam a criação de mundos de simulação com recursos cada vez mais avançados para interação humana ou agentes de inteligência artificial treinados.

O Genie 2 possibilitou a geração baseada em imagens de 3 cenários virtuais 3D altamente consistentes de até um minuto de duração que respondem de forma inteligente às ações realizadas, identificando o personagem e movendo-o corretamente.

Seu sucessor, o Genie 3, dá um passo adiante e introduz a interação em tempo real em simulações de mundos mais realistas de ecossistemas repletos de vida vegetal e animal, permitindo a experiência de fenômenos naturais, como água, iluminação e exploração.

Esses mundos permanecem constantes por vários minutos em resolução de 720p porque, como o Google DeepMind explicou em um comunicado, eles são criados "quadro a quadro de acordo com a descrição do mundo e as ações do usuário".

Em termos de controlabilidade, além das entradas de navegação, com teclas direcionais, ele permite a interação com prompts de texto, resultando em eventos de mundo programáveis, que podem ser usados para introduzir alterações e verificar como os agentes de IA lidam com situações inesperadas.

Embora os mundos gerados pelo Genie possam ser controlados por humanos ou agentes, o Google DeepMind vê seu potencial para treinar os últimos. A maior consistência oferecida pelo Genie 3 abre a porta para sequências mais longas que impulsionam a realização de objetivos mais complexos.

"Ele não apenas oferece amplo espaço para treinar agentes, como robôs e sistemas autônomos, mas também nos permite avaliar o desempenho do agente e explorar seus pontos fracos", afirmam no comunicado.

Mesmo assim, o Genie 3 tem limitações, pois os agentes têm uma gama restrita de ações e a interação entre vários agentes independentes não é incorporada. Ele também não pode simular com precisão locais do mundo real e a duração das interações é de apenas alguns minutos.

Esta notícia foi traduzida por um tradutor automático

Novo modelo do Google DeepMind gera mundos interativos consistentes e de vários minutos para agentes de treinamento

Contenido patrocinado