A DeepSeek lança o DSpark, uma nova estrutura que acelera a velocidade de resposta da IA em 57% a 85%

Archivo - Arquivo - ARQUIVADO - 28 de janeiro de 2025, Brandemburgo, Sieversdorf: O logotipo da startup chinesa de IA DeepSeek pode ser visto em um smartphone em Brandemburgo. Foto: Patrick Pleul/dpa

Patrick Pleul/dpa - Arquivo

MADRID 30 jun. (Portaltic/EP) -

O laboratório de Inteligência Artificial (IA) responsável pelo DeepSeek lançou em código aberto o DSpark, uma nova estrutura (framework) projetada para acelerar a velocidade de inferência, ou seja, o tempo de resposta, dos modelos de linguagem de grande porte (LLMs) entre 57% e 85%.

Lançado neste fim de semana, o DSpark é um sistema com licença MIT projetado para que os LLMs respondam mais rapidamente, sem alterar o conteúdo ou a qualidade das respostas do modelo.

Esse sistema atende a um setor em que os LLMs mais conhecidos, como ChatGPT, Claude ou Gemini, baseiam seu funcionamento na geração de texto palavra por palavra, o que é conhecido como “token” por “token”. Embora isso torne o resultado mais preciso, também torna todo o processo mais lento.

Por outro lado, o DSpark da DeepSeek utiliza uma técnica conhecida como decodificação especulativa. Seu funcionamento se assemelha ao de uma espécie de “explorador” que se antecipa para adivinhar as palavras seguintes e, com isso, aumentar a velocidade de resposta.

Isso faz com que o LLM revise e valide blocos inteiros de texto de uma só vez, em vez de esperar que o sistema aprove cada palavra ou “token” antes de passar para o próximo bloco, como ocorre com os LLMs tradicionais, que costumam gerar gargalos e retardar a resposta.

Em testes reais realizados com o DeepSeek, a DSpark obteve um aumento de velocidade por usuário entre 60% e 85% ao integrá-lo ao DeepSeek-V4-Flash. Já no DeepSeek-V4-Pro, o modelo de ponta da empresa chinesa, foi alcançada uma aceleração entre 57% e 78%.

De fato, em situações de alta saturação do servidor (devido a uma grande demanda de processamento), a capacidade total de processamento chegou a ser multiplicada por 4 a 6 vezes em comparação com o sistema anterior.

A DeepSeek publicou esses resultados em um documento técnico e por meio do DeepSpec, um código-fonte responsável por treinar e avaliar sistemas de decodificação especulativa. O DSpark está disponível no GitHub da DeepSeek e nas páginas do Hugging Face, podendo, portanto, já ser utilizado por desenvolvedores, pesquisadores ou empresas.

Enquanto os laboratórios de IA ocidentais buscam ampliar as capacidades de seus LLMs com a implantação de megacentros de dados — como a Meta está fazendo com centros de dados como o Hyperion —, a estratégia da chinesa DeepSeek concentra-se na otimização do “software” para resolver o desafio econômico da velocidade, fazendo com que a IA responda mais rapidamente sem que os custos dos servidores tornem o negócio inviável.

Vale destacar que a nova estrutura da DeepSeek não limita seu uso aos modelos da própria empresa, mas, graças à publicação dos pontos de controle, abrange outras famílias de modelos abertos, como o Qwen (da Alibaba) ou o Gemma, do Google.

Os que ficam de fora, por enquanto, são os modelos comerciais, como os da Anthropic ou da OpenAI, que se conectam por meio de uma API. Para que funcione, o DSpark precisa de acesso total ao sistema de inferência desses modelos.

Esta notícia foi traduzida por um tradutor automático

A DeepSeek lança o DSpark, uma nova estrutura que acelera a velocidade de resposta da IA em 57% a 85%

Contenido patrocinado