Publicado 07/04/2026 11:26

A Netflix apresenta o VOID, uma IA de código aberto para remover objetos de vídeos e modificar as interações com eles

Tecnologia VOID da Netflix.
NETFLIX.

MADRID 7 abr. (Portaltic/EP) -

A Netflix apresentou o VOID, um modelo de inteligência artificial (IA) capaz de remover objetos em movimento de vídeos, bem como modificar as interações com eles por meio de uma reconstrução.

Atualmente, os métodos para remover objetos de vídeos concentram-se em preencher o conteúdo que está atrás do objeto e corrigir suas sombras e reflexos. No entanto, essa tarefa se complica quando o objeto removido interage com outros, o que resulta em resultados pouco convincentes.

Diante desse problema, a Netflix desenvolveu um modelo baseado na arquitetura CogVideoX e otimizado para o processamento de imagens em vídeos por meio de um condicionamento de máscara quádrupla sensível à interação, conforme explicado no repositório Hugging Face.

Concretamente, o VOID trabalha com uma máscara de quatro valores que codifica o objeto principal para removê-lo, as áreas sobrepostas, as partes com as quais ele interage e o fundo para mantê-lo.

Dessa forma, o VOID realiza uma primeira passagem com o objeto e suas interações removidas. Se for detectado um erro, é realizada uma segunda passagem com o objetivo de estabilizar a forma do objeto seguindo a trajetória analisada.

Para treinar o modelo, a equipe da Netflix, em parceria com a Universidade de Sofia (Bulgária), utilizou duas fontes: HUMOTO, para interações entre humanos e objetos renderizadas no Blender com simulação física; e Kubric, para interações apenas entre objetos por meio do 'Google Scanned Objects'.

O VOID, sigla para Video Object and Interaction Deletion (eliminação de objetos e interações de vídeo), é um modelo de código aberto e pode ser encontrado em repositórios como o GitHub ou o Hugging Face, permitindo que tanto criadores quanto pesquisadores o testem e experimentem gratuitamente.

Graças ao modelo VOID, é possível remover pessoas ou modificar os vídeos conforme a preferência dos usuários. Para mostrar alguns resultados, a página oficial do VOID incluiu demonstrações com diferentes modos de uso para verificar como esse modelo funciona em comparação com outros.

Um dos exemplos mais claros é aquele em que o VOID remove uma prensa que esmaga um pato de borracha. Enquanto os demais modelos eliminam a prensa e mantêm o pato de borracha esmagado, o VOID mantém o pato intacto, editando assim o objeto com o qual o objeto eliminado interage.

No entanto, embora seja um avanço, essa tecnologia também apresenta riscos potenciais. Um uso indevido dela poderia ajudar a gerar conteúdo manipulado e fomentar a desinformação, tornando ainda mais tênue a linha entre realidade e ficção.

Esta notícia foi traduzida por um tradutor automático

Contador

Contenido patrocinado