Peter Kneffel/dpa - Arquivo
MADRID 1 maio (Portaltic/EP) -
A Microsoft ampliou sua família de modelos de linguagem pequenos (SLM) Phi com os novos Phi-4-reasoning, Phi-4-reasoning-plus e Phi-4-mini-reasoning, que integram recursos de raciocínio com resultados comparáveis aos de modelos maiores, equilibrando tamanho e desempenho, especialmente em áreas como raciocínio matemático e questões científicas.
A empresa de tecnologia lançou os modelos Phi-4-multimodal e Phi-4-mini SLM em fevereiro, projetados para oferecer aos desenvolvedores recursos avançados de Inteligência Artificial (IA) para tarefas de processamento de fala, texto e imagem.
A Microsoft agora expandiu essa família com novos modelos que integram recursos de raciocínio, redefinindo "o que é possível com IA pequena e eficiente" com o Phi-4-reasoning, Phi-4-reasoning-plus e Phi-4-mini-reasoning.
Como a empresa explicou em uma declaração em seu blog, os modelos de raciocínio são treinados para aproveitar o escalonamento do tempo de inferência e "executar tarefas complexas que exigem decomposição em várias etapas e reflexão interna", destacando-se em tarefas matemáticas e aplicativos de agência.
Assim, embora esses recursos sejam normalmente encontrados em modelos grandes, os novos modelos de raciocínio Phi-4 introduzem "uma nova categoria de modelos de linguagem pequenos", possibilitados pelo treinamento baseado em destilação, aprendizado por reforço e dados de alta qualidade, equilibrando tamanho e desempenho.
Em outras palavras, a Microsoft conseguiu fornecer modelos que são pequenos o suficiente para serem executados em ambientes de baixa latência, mas que mantêm recursos de raciocínio robustos que "rivalizam até mesmo com modelos muito maiores". Ao fazer isso, a empresa permite que dispositivos com recursos limitados executem tarefas de raciocínio complexas com eficiência.
Nessa estrutura, o Phi-4-reasoning é um modelo de raciocínio de peso aberto com 14 bilhões de parâmetros e foi treinado com demonstrações de raciocínio "cuidadosamente selecionadas" do modelo o3-mini da OpenAI, o que o torna capaz de gerar cadeias de raciocínio detalhadas que aproveitam com eficiência a computação adicional no momento da inferência.
O Phi-4-reasoning-plus se baseia nos recursos do Phi-4-reasoning, mas tem um treinamento mais extenso baseado no aprendizado por reforço para usar mais tempo de inferência, usando 1,5 vez mais tokens do que o Phi-4-reasoning. Ao fazer isso, ele é capaz de fornecer maior precisão em suas respostas e na execução da tarefa.
Nesse sentido, a Microsoft afirma que ambos os modelos superam modelos comparáveis do setor, como o1-mini da OpenAI e DeepSeek-R1-Distill-Llama-70B, na maioria dos testes de benchmark, incluindo raciocínio matemático e questões científicas de nível de doutorado. Eles também demonstram altas habilidades em codificação, resolução de problemas algorítmicos e planejamento.
A Microsoft também introduziu o modelo de raciocínio Phi-4-mini. Nesse caso, ele foi projetado para atender à demanda por um modelo de raciocínio compacto e é otimizado para raciocínio matemático, oferecendo solução de problemas passo a passo, mesmo em ambientes com restrições computacionais ou de latência.
Ele foi treinado com dados sintéticos gerados pelo modelo Deepseek-R1, portanto, equilibra eficiência com capacidade de raciocínio avançado. De acordo com a Microsoft, seu foco são os aplicativos educacionais e a implantação leve em sistemas móveis ou de borda.
Os modelos Phi-4-reasoning, Phi-4-reasoning-plus e Phi-4-mini-reasoning já estão disponíveis para uso no Azure AI Foundry e no Hugging Face.
Esta notícia foi traduzida por um tradutor automático