Os novos modelos Phi-4-reasoming da Microsoft integram recursos de raciocínio, equilibrando tamanho e desempenho

Archivo - FILED - 26 de março de 2021, Baviera, Munique: O logotipo da Microsoft está pendurado na fachada de um prédio de escritórios em Parkstadt Schwabing, no norte da capital da Baviera. Na terça-feira, a Comissão Europeia informou à Microsoft que sus

Peter Kneffel/dpa - Arquivo

MADRID 1 maio (Portaltic/EP) -

A Microsoft ampliou sua família de modelos de linguagem pequenos (SLM) Phi com os novos Phi-4-reasoning, Phi-4-reasoning-plus e Phi-4-mini-reasoning, que integram recursos de raciocínio com resultados comparáveis aos de modelos maiores, equilibrando tamanho e desempenho, especialmente em áreas como raciocínio matemático e questões científicas.

A empresa de tecnologia lançou os modelos Phi-4-multimodal e Phi-4-mini SLM em fevereiro, projetados para oferecer aos desenvolvedores recursos avançados de Inteligência Artificial (IA) para tarefas de processamento de fala, texto e imagem.

A Microsoft agora expandiu essa família com novos modelos que integram recursos de raciocínio, redefinindo "o que é possível com IA pequena e eficiente" com o Phi-4-reasoning, Phi-4-reasoning-plus e Phi-4-mini-reasoning.

Como a empresa explicou em uma declaração em seu blog, os modelos de raciocínio são treinados para aproveitar o escalonamento do tempo de inferência e "executar tarefas complexas que exigem decomposição em várias etapas e reflexão interna", destacando-se em tarefas matemáticas e aplicativos de agência.

Assim, embora esses recursos sejam normalmente encontrados em modelos grandes, os novos modelos de raciocínio Phi-4 introduzem "uma nova categoria de modelos de linguagem pequenos", possibilitados pelo treinamento baseado em destilação, aprendizado por reforço e dados de alta qualidade, equilibrando tamanho e desempenho.

Em outras palavras, a Microsoft conseguiu fornecer modelos que são pequenos o suficiente para serem executados em ambientes de baixa latência, mas que mantêm recursos de raciocínio robustos que "rivalizam até mesmo com modelos muito maiores". Ao fazer isso, a empresa permite que dispositivos com recursos limitados executem tarefas de raciocínio complexas com eficiência.

Nessa estrutura, o Phi-4-reasoning é um modelo de raciocínio de peso aberto com 14 bilhões de parâmetros e foi treinado com demonstrações de raciocínio "cuidadosamente selecionadas" do modelo o3-mini da OpenAI, o que o torna capaz de gerar cadeias de raciocínio detalhadas que aproveitam com eficiência a computação adicional no momento da inferência.

O Phi-4-reasoning-plus se baseia nos recursos do Phi-4-reasoning, mas tem um treinamento mais extenso baseado no aprendizado por reforço para usar mais tempo de inferência, usando 1,5 vez mais tokens do que o Phi-4-reasoning. Ao fazer isso, ele é capaz de fornecer maior precisão em suas respostas e na execução da tarefa.

Nesse sentido, a Microsoft afirma que ambos os modelos superam modelos comparáveis do setor, como o1-mini da OpenAI e DeepSeek-R1-Distill-Llama-70B, na maioria dos testes de benchmark, incluindo raciocínio matemático e questões científicas de nível de doutorado. Eles também demonstram altas habilidades em codificação, resolução de problemas algorítmicos e planejamento.

A Microsoft também introduziu o modelo de raciocínio Phi-4-mini. Nesse caso, ele foi projetado para atender à demanda por um modelo de raciocínio compacto e é otimizado para raciocínio matemático, oferecendo solução de problemas passo a passo, mesmo em ambientes com restrições computacionais ou de latência.

Ele foi treinado com dados sintéticos gerados pelo modelo Deepseek-R1, portanto, equilibra eficiência com capacidade de raciocínio avançado. De acordo com a Microsoft, seu foco são os aplicativos educacionais e a implantação leve em sistemas móveis ou de borda.

Os modelos Phi-4-reasoning, Phi-4-reasoning-plus e Phi-4-mini-reasoning já estão disponíveis para uso no Azure AI Foundry e no Hugging Face.

Esta notícia foi traduzida por um tradutor automático

Os novos modelos Phi-4-reasoming da Microsoft integram recursos de raciocínio, equilibrando tamanho e desempenho

Contenido patrocinado