MADRID 13 fev. (Portaltic/EP) - A ByteDance, empresa responsável pelo Tiktok, lançou o Seedance 2.0, um modelo multimodal de geração de imagens e vídeos que melhora a qualidade em relação ao seu antecessor, para obter resultados profissionais, com efeitos visuais realistas e som estéreo de canal duplo.
O Seedance 2.0 oferece “uma experiência criativa completamente nova para os usuários”, segundo a empresa em um comunicado, graças à entrada multimodal, que suporta texto, imagens, áudio e vídeo, e às suas capacidades de criação e edição de conteúdo de nível industrial.
Os usuários podem inserir simultaneamente texto, até nove imagens, três clipes de vídeo e três clipes de áudio e indicar suas instruções por meio de linguagem natural para ter maior controle sobre o que desejam gerar, mantendo uma consistência estável do tema.
Na geração de vídeo, eles também podem especificar elementos como composição, ação, movimento da câmera, efeitos especiais e som nos materiais de entrada. O modelo se destaca por reproduzir de forma realista as leis da física para oferecer movimentos e interações complexas sincronizadas e precisas, e oferecer um resultado que mantém uma consistência estável do tema.
O Seedance 2.0 também integra a tecnologia de som estéreo de canal duplo para obter efeitos mais realistas e imersivos. Com a saída paralela multitrack, introduz música de fundo, efeitos sonoros ambientais ou narração de personagens para se adaptar ao ritmo da cena.
Ele também reproduz com realismo sons que a ByteDance classifica como “delicados”, como o leve atrito do vidro fosco, o atrito da lã, o bater de lâminas acrílicas e o som controlado do plástico bolha.
Esta notícia foi traduzida por um tradutor automático