Publicado 19/03/2025 07:50

Nvidia impulsiona o desenvolvimento de robôs humanoides com o novo modelo aberto Isaac GROOT N1

A Nvidia está impulsionando o desenvolvimento de robôs humanoides com seu novo modelo aberto Isaac GROOT N1.
NVIDIA

MADRI 19 mar. (Portaltic/EP) -

A Nvidia revelou o Isaac GROOT N1, o primeiro modelo de base aberto e personalizável projetado para levar habilidades e raciocínio generalizados a robôs humanoides, além de apresentar o mecanismo de física de código aberto para o desenvolvimento de robôs Newton.

Falando na conferência GTC 2025, o fundador e CEO da Nvidia, Jensen Huang, enfatizou a importância do setor de robótica, observando que, até o final desta década, o mundo terá um déficit de pelo menos 50 milhões de trabalhadores.

Com isso em mente, a Nvidia planeja oferecer um conjunto de tecnologias para treinar, implantar, simular e testar a robótica de próxima geração. Assim, entre outras notícias, ela anunciou a disponibilidade do Isaac GROOT N1, o primeiro modelo de base aberto e personalizável para raciocínio e habilidades humanoides.

Como a empresa de tecnologia detalhou em um comunicado, o GROOT N1 já está disponível e é o primeiro de uma família de modelos personalizáveis que a Nvidia pré-treinará para uso posterior por desenvolvedores de robótica em todo o mundo.

Especificamente, esse modelo básico apresenta uma arquitetura de sistema duplo, inspirada nos "princípios da cognição humana". De acordo com a empresa, o primeiro sistema (System 1) é um modelo de ação de raciocínio rápido, que representa os reflexos ou a intuição humana e é treinado com a plataforma Nvidia Omniverse.

O segundo sistema (System 2) usa um modo de pensamento lento para a tomada de decisões deliberadas e metódicas. Esse sistema é capaz de raciocinar sobre seu ambiente e, com base nas instruções que recebe, planejar ações. Além disso, o Sistema 1 traduz esses planos elaborados pelo Sistema 2 em movimentos robóticos precisos e contínuos.

Dessa forma, o GROOT N1 pode generalizar tarefas comuns, como agarrar, mover objetos para outros locais ou transferi-los de um braço para outro. Ele também permite tarefas de várias etapas que exigem um contexto amplo e uma combinação de habilidades gerais. Isso pode ser aplicado a casos de uso como o manuseio de materiais em fábricas.

Além disso, esse modelo se destaca por ser personalizável, de modo que os desenvolvedores podem treinar o GROOT N1 com dados reais ou sintéticos para permitir que seu robô humanoide execute tarefas específicas. Para demonstrar os recursos do modelo Isaac GROOT N1, a Nvidia usou o robô humanoide 1X, que executou tarefas domésticas de forma autônoma.

Os dados de treinamento e os cenários de avaliação de tarefas do GROOT N1 já estão disponíveis para download no Hugging Face e no GitHub. A Nvidia também observou que o projeto Isaac GROOT para geração de movimento também está disponível como uma demonstração interativa no serviço build.nvidia.com e no GitHub.

MECANISMO DE FÍSICA NEWTON PARA SIMULAÇÃO DE ROBÔS

Em consonância com isso, a Nvidia também apresentou o Newton, um mecanismo de física de código aberto desenvolvido em conjunto com o Google DeepMind e a Disney Research, projetado para simulação robótica, que permite que os robôs aprendam a lidar com tarefas complexas com maior precisão.

O mecanismo é baseado na estrutura Nvidia Wrap e será compatível com plataformas de simulação como o MuJoCo do Google DeepMind e o NVIDIA Isaac Lab. Especificamente, com o desenvolvimento em conjunto com o Google DeepMind, espera-se que as cargas de trabalho de aprendizado de máquina robótica sejam aceleradas em mais de 70 vezes.

Da mesma forma, a Disney Research será uma das primeiras empresas a usar o Newtron para sua plataforma de personagens robóticos que alimenta robôs de entretenimento de última geração, como os droides BDX inspirados em Star Wars. No entanto, espera-se que o mecanismo de física Newton esteja disponível ainda este ano.

MODELOS BÁSICOS DO NVIDIA COSMOS

Além de tudo isso, a Nvidia lançou novos modelos básicos do Nvidia Cosmos, que apresentam recursos de raciocínio abertos e personalizáveis para o desenvolvimento de IA de física, oferecendo aos desenvolvedores "controle sem precedentes sobre a geração de mundos".

Esses modelos, alimentados pelas plataformas NVIDIA Omniverse e Cosmos, oferecem aos desenvolvedores mecanismos de geração de dados sintéticos maciços e controláveis para robôs e veículos autônomos pós-treinamento.

Por um lado, a Nvidia apresentou os modelos Cosmos Transfer, que permitem a ingestão de entradas de vídeo estruturadas, como mapas de segmentação, mapas de profundidade, varreduras lidar ou mapas de trajetória, para gerar saídas de vídeo fotorrealistas que se traduzem na geração de dados sintéticos controláveis em grande escala.

A empresa de tecnologia também apresentou os modelos Cosmos Predict, que foram anunciados na CES em janeiro. Esses modelos geram estados de mundo virtual a partir de entradas multimodais, como texto, imagens ou vídeo. Dessa forma, eles permitem a geração de vários quadros, prevendo ações intermediárias ou trajetórias de movimento ao receber imagens de entrada inicial e final, conforme explicou a empresa.

Por fim, o Cosmos Reason é outro dos modelos apresentados, também com recursos de personalização, tem consciência espaço-temporal e usa raciocínio para entender dados de vídeo e prever os resultados de interações em linguagem natural.

Em suma, os modelos Cosmos estão disponíveis para visualização no catálogo de APIs da Nvidia e no Vertex AI Model Garden do Google Cloud. O Cosmos Predict e o Trasnfer também estão disponíveis abertamente no Hugging Gace e no GitHub. O Cosmos Reason está disponível em acesso antecipado.

"Assim como os grandes modelos de linguagem revolucionaram a IA generativa e de agentes, os modelos de base mundial do Cosmos são um avanço para a IA física", disse Jensen Huang.

Esta notícia foi traduzida por um tradutor automático

Contenido patrocinado