Patrick Pleul/dpa - Arquivo
MADRI 30 set. (Portaltic/EP) -
A DeepSeek lançou um novo modelo experimental de inteligência artificial (IA) denominado V3.2-Exp, que foi projetado para reduzir o custo da inferência por meio de uma abordagem de "atenção esparsa", obtendo melhorias significativas na eficiência, tanto no treinamento quanto na inferência, especialmente em cenários de contexto longo.
Esse novo modelo foi desenvolvido com base no modelo anterior da tecnologia chinesa V3.1-Terminus. No entanto, ao integrar o sistema "DeepSeek Sparse Attention" (DSA), ele melhora a eficiência de tal forma que os preços de API podem ser reduzidos em 50%.
Conforme a descrição da empresa, o DSA tem como objetivo obter treinamento e inferência "mais rápidos e eficientes" em um contexto longo. Para isso, conforme esclarecido em uma publicação em seu site e em um artigo no GitHub, ele se baseia em um sistema que usa um módulo chamado 'Lightning indexer', que prioriza fragmentos específicos da janela de contexto.
Em seguida, esses fragmentos passam por um processo de "seleção de tokens refinados", que são usados pelo modelo em sua janela de atenção esparsa para processar solicitações.
Como resultado desse processo, o modelo pode levar em conta grandes proporções de contexto e várias linhas de pensamento simultaneamente, mas com cargas de informações menores, resultando em melhor desempenho e menor custo computacional.
A empresa também detalhou que, de acordo com seus testes internos, os benchmarks obtidos mostram que o V3.2-Exp tem o mesmo desempenho do V3.1-Terminus, tanto no nível do agente de pesquisa quanto em tarefas de codificação e matemática.
O DeepSeek disponibilizou a nova V3.2-Exp em formato aberto, para que os usuários possam testá-la por meio do aplicativo DeepSeek, da versão web e de sua API. É nesse último caso que ele enfatizou que os preços são reduzidos em mais de 50% "com efeito imediato", graças à eficiência obtida.
Em suma, deve-se ter em mente que, no momento, o DeepSeek V3.2-Exp é um modelo experimental, portanto, a empresa estará aprimorando seus recursos para versões futuras.
Esta notícia foi traduzida por um tradutor automático