MADRID 5 ago. (Portaltic/EP) -
A Google DeepMind apresentou a nova versão de seu modelo Genie, que integra a capacidade de gerar ambientes dinâmicos mais realistas com interação em tempo real durante vários minutos.
Os modelos Genie possibilitam a criação de mundos de simulação com recursos cada vez mais avançados para interação humana ou agentes de inteligência artificial treinados.
O Genie 2 possibilitou a geração baseada em imagens de 3 cenários virtuais 3D altamente consistentes de até um minuto de duração que respondem de forma inteligente às ações realizadas, identificando o personagem e movendo-o corretamente.
Seu sucessor, o Genie 3, dá um passo adiante e introduz a interação em tempo real em simulações de mundos mais realistas de ecossistemas repletos de vida vegetal e animal, permitindo a experiência de fenômenos naturais, como água, iluminação e exploração.
Esses mundos permanecem constantes por vários minutos em resolução de 720p porque, como o Google DeepMind explicou em um comunicado, eles são criados "quadro a quadro de acordo com a descrição do mundo e as ações do usuário".
Em termos de controlabilidade, além das entradas de navegação, com teclas direcionais, ele permite a interação com prompts de texto, resultando em eventos de mundo programáveis, que podem ser usados para introduzir alterações e verificar como os agentes de IA lidam com situações inesperadas.
Embora os mundos gerados pelo Genie possam ser controlados por humanos ou agentes, o Google DeepMind vê seu potencial para treinar os últimos. A maior consistência oferecida pelo Genie 3 abre a porta para sequências mais longas que impulsionam a realização de objetivos mais complexos.
"Ele não apenas oferece amplo espaço para treinar agentes, como robôs e sistemas autônomos, mas também nos permite avaliar o desempenho do agente e explorar seus pontos fracos", afirmam no comunicado.
Mesmo assim, o Genie 3 tem limitações, pois os agentes têm uma gama restrita de ações e a interação entre vários agentes independentes não é incorporada. Ele também não pode simular com precisão locais do mundo real e a duração das interações é de apenas alguns minutos.
Esta notícia foi traduzida por um tradutor automático