MADRI 7 abr. (Portaltic/EP) -
A Meta revelou a próxima geração de seus modelos de Inteligência Artificial (IA) Llama 4, com as versões Llama 4 Scout, Maverick e Behemoth, esta última um dos modelos de linguagem grande (LLM) "mais inteligentes do mundo", com 288 bilhões de parâmetros e recursos que superam os modelos mais avançados do setor.
A empresa de tecnologia liderada por Mark Zuckerberg apresentou seu novo conjunto de modelos, que define como "os mais avançados" compatíveis com todo o ecossistema Llama, e com os quais pretende continuar oferecendo opções abertas para que qualquer usuário possa "construir o futuro das experiências personalizadas".
Assim, com a coleção Llama 4, a Meta pretende impulsionar sistemas mais inteligentes que sejam capazes de realizar ações generalizadas, bem como se comunicar naturalmente com os seres humanos e resolver problemas desafiadores que não foram abordados anteriormente.
Nesse sentido, a Meta introduziu a Llama 4 com o lançamento da Llama 4 Scout e da Llama 4 Maverick, os primeiros modelos multimodais nativos de "peso aberto", que oferecem suporte "sem precedentes" ao comprimento do contexto e são os primeiros a se basear em uma arquitetura de mistura de especialistas (MoE).
O modelo Llama 4 Scout tem 17 bilhões de parâmetros ativos com 16 especialistas e pode ser integrado em uma única GPU Nvidia H100, e com uma janela de contexto de 10 milhões de tokens, é capaz de superar os modelos de outros participantes do setor, como Gemma 3 e Gemini 2.0 Flash-Lite e Mistral 3.1 do Google, disse a empresa em uma postagem no blog.
Enquanto isso, o Llama 4 Maverick também é um modelo com 17 bilhões de parâmetros ativos, mas é baseado em 128 especialistas e pode ser integrado a um único host Nvidia H100 DGX. Nesse caso, trata-se de um modelo maior, e a Meta indicou que ele fornece resultados comparáveis aos do DeepSeek-V3 em codificação e raciocínio usando menos parâmetros ativos, e que supera modelos comparáveis como GPT-4o e Gemini 2.0 em codificação, raciocínio, multilíngue, contexto longo e benchmarks de imagem.
No caso do Scout, a Meta apontou que ele é um modelo projetado para lidar com tarefas como resumo de vários documentos, análise da atividade extensiva do usuário para tarefas personalizadas e raciocínio sobre grandes bases de código. Da mesma forma, o Maverick se destaca na compreensão de imagens e textos, permitindo a criação de aplicativos sofisticados de IA que "superam as barreiras do idioma", bem como a escrita criativa.
Por serem baseados em uma arquitetura MoE, esses modelos alcançam maior eficiência computacional para treinamento e inferência, o que, com um orçamento fixo de FLOPs de treinamento, significa que eles oferecem maior qualidade em comparação com um modelo denso, disse Meta. Essa eficiência se baseia na conservação de recursos por meio de especialistas roteados, pois permite que o modelo use apenas as partes necessárias para executar uma tarefa específica.
O Llama 4 Scout e o Llama 4 Maverick já estão disponíveis para download em llama.com e Hugging Face, permitindo que os usuários comecem a criar "novas experiências" com sua tecnologia mais recente. Eles também estão disponíveis para todos os usuários via WhatsApp, Messenger, Instagram Direct e o site da Meta AI.
LLAMA 4 BEHEMOTH
Além de tudo isso, a Meta também revelou seu modelo Llama 4 Behemoth LLM, que ela descreve como "um dos LLMs mais inteligentes do mundo", sendo seu modelo mais poderoso até o momento.
Especificamente, ele tem 288 bilhões de parâmetros ativos com 16 especialistas e, ao fazer isso, a empresa de tecnologia afirmou que esse modelo supera outros modelos do setor, como o GPT-4.5 da OpenAI, o Claude Sonnet 3.7 da Anthropic e o Gemini 2.0 Pro do Google, em marcas focadas em STEM, como MATH-500 e GPQA Diamond.
Assim, a Meta explicou que, embora o Behemoth ainda esteja em desenvolvimento e treinamento, ele será usado como guia para seus novos modelos, devido à sua alta capacidade de inteligência.
A Meta disse que compartilhará mais informações sobre seus novos modelos Llama 4 em sua conferência de desenvolvedores, a LlamaCon, a ser realizada em 29 de abril.
Esta notícia foi traduzida por um tradutor automático