Publicado 18/02/2025 06:36

O modelo Grok 3 se baseia na pesquisa profunda e promete superar o GPT-4o com raciocínio em nível de doutorado.

Logo de Grok
X

MADRI, 18 fev. (Portaltic/EP) -

Os membros da divisão de Inteligência Artificial (IA) da X, xAI, e o proprietário da plataforma, Elon Musk, revelaram sua nova família de modelos de linguagem Grok 3, que se baseará no mecanismo de pesquisa Deep Search e promete superar o GPT-4o da OpenAI nos testes AIME e GPQA para raciocínio em nível de doutorado.

A revelação do novo modelo de IA da X ocorreu na segunda-feira, em um webcast que durou cerca de uma hora e explicou em detalhes o que é considerado "a IA mais inteligente do planeta", nas palavras do proprietário da plataforma, Elon Musk.

Essa versão aprimorada do Grok 2 inclui os recursos de seu antecessor, com melhorias em seções como bate-papo ou raciocínio, bem como a geração de imagens; e acrescenta outros, como a capacidade de refletir sobre os erros que comete, a fim de obter coerência lógica.

A divisão de inteligência artificial da X também indicou que planejava lançar o Grok 3 em 2024. No entanto, foram necessários mais alguns meses para refiná-lo, testar novos recursos e transformá-lo em um modelo de raciocínio "muito mais capaz do que o Grok 2", disse Musk na apresentação.

Isso está de acordo com o que ele disse há alguns dias, quando afirmou na X que havia concluído a fase de pré-treinamento do modelo "com 10 vezes o poder de processamento do Grok 2". No entanto, a reunião sugeriu que "talvez" ele tenha 15 vezes mais capacidade.

Em primeiro lugar, o proprietário do X apontou que o Grok e, mais especificamente, a família de modelos Grok 3, que ocultará seus processos de raciocínio, consiste no Grok-3 Reasoning e no Grok-3 Mini Reasoning, que responde mais rapidamente, mas sacrifica a precisão de suas respostas para fazer isso, como ele sugeriu.

Ele também destacou que essa família foi criada "com a missão de entender o universo" e que, por esse motivo, ainda está "em uma espécie de beta", pois alguns de seus recursos ainda são "irregulares", como o modo de voz. "Literalmente, em 24 horas você verá melhorias", acrescentaram outros membros da equipe da xAI durante a transmissão.

"Acreditamos que ter o melhor modelo de treinamento não é suficiente. A melhor IA precisa pensar como um ser humano. Ela precisa considerar todas as respostas possíveis, avaliar a si mesma e verificar se há erros", acrescentaram os desenvolvedores do Grok 3, que indicaram que ele pode resolver tarefas relacionadas às disciplinas STEM.

A esse respeito, a xAI também disse que o Grok 3 supera o GPT-4o em testes de referência, como o USA Math Olympiad (AIME), que avalia o desempenho de um modelo em uma amostra de questões de matemática, e o GPQA, que avalia modelos usando problemas de física, biologia e química em nível de doutorado.

Assim, o Grok 3 Reasoning e o Grok 3 mini Reasoning podem "pensar" cuidadosamente sobre os problemas, semelhante a modelos de raciocínio como o o3-mini da OpenAI e o R1 da DeepSeek. Além disso, o primeiro supera a melhor versão do o3-mini-high em vários benchmarks, como o AIME 2025.

Além disso, os novos modelos de raciocínio da xAI sustentam um novo recurso no aplicativo para iOS e Android chamado DeepSearch. Assim como as propostas do Google e da OpenAI com nomes semelhantes, essa ferramenta de pesquisa reúne informações da Internet e do aplicativo X para fornecer um resumo abrangente com base na consulta feita.

O Grok 3 chegará primeiro para os assinantes Premium+ do X, embora outros recursos estejam restritos a um novo plano que a xAI chamou de SuperGrok. Esse plano desbloqueia consultas de raciocínio adicionais, DeepSearch e oferece geração ilimitada de imagens.

Por fim, os funcionários da Grok disseram que os modelos do Grok 3 estarão disponíveis por meio da interface de programação de aplicativos (API) da xAI em algumas semanas, juntamente com o DeepSearch, e que também planejam lançar o código-fonte do Grok 2 nos próximos meses.

Esta notícia foi traduzida por um tradutor automático