Publicado 02/10/2025 07:05

A Wikimedia oferece aos aplicativos de IA acesso a um banco de dados verificável, gratuito e aberto.

Recurso do projeto de incorporação Wikidata
WIKIMEDIA

MADRID 2 out. (Portaltic/EP) -

A Wikimedia lançou o Wikidata Embedding, um projeto que busca fornecer aos desenvolvedores de aplicativos de inteligência artificial (IA) generativa acesso a dados verificáveis, gratuitos e abertos.

O novo projeto de incorporação apresentado pela Wikimedia Alemanha oferece um banco de dados de cerca de 120 milhões de entradas do Wikidata revisadas por profissionais para uso em aplicativos de IA generativa.

Trata-se de dados estruturados, projetados para linguagem natural e, para que os modelos de IA possam entendê-los, eles oferecem o conteúdo como dados vetoriais. Com o Protocolo de Contexto de Modelo (MCP), eles garantem que a IA possa se comunicar com o banco de dados e, com a técnica de Geração Aumentada de Recuperação (RAG), ela pode recuperar dados atualizados, o que ajuda a reduzir respostas incorretas ou inventadas.

Com isso, eles buscam resolver um problema já observado em aplicativos como o ChatGPT ou a pesquisa de IA do Google, que "muitas vezes não fornecem respostas confiáveis" e "as referências precisas às fontes são escassas, pois a maioria dos sistemas de IA depende de conjuntos de dados opacos", afirmam em uma declaração compartilhada em seu blog oficial.

O projeto conta com o apoio da DataStax, uma empresa da IBM e fornecedora líder de soluções de IA e dados, e da Jina AI, uma empresa com sede em Berlim especializada em pesquisa baseada em IA, e é voltado para desenvolvedores com poucos recursos e para o movimento de código aberto.

Esta notícia foi traduzida por um tradutor automático

Contenido patrocinado