MADRID 5 maio (Portaltic/EP) -
O Google confirmou que pode continuar a treinar seus produtos de Inteligência Artificial (IA) para pesquisa, como as visões gerais de IA, com conteúdo da Web, independentemente de os editores terem optado por não participar do treinamento da IA do Google com seus dados.
Serviços como a "visualização criada por IA" do Google ou as visões gerais de IA resumem as respostas às consultas de pesquisa dos usuários usando IA e as exibem na parte superior dos resultados. Isso facilita a localização de informações detalhadas sobre o que você está procurando de forma mais rápida e fácil.
Para fornecer esses resultados de visões gerais de IA, o Google usa as informações que encontra nos sites e as resume, mas os editores desses sites podem optar por não receber o treinamento de IA do Google com seus dados.
Agora, a gigante da tecnologia declarou que pode continuar a usar dados de sites para treinar seus produtos de IA para pesquisa, como o AI Overviews, mesmo que os editores desses sites optem por não participar do treinamento de produtos de IA do Google.
Isso foi detalhado pelo vice-presidente do Google DeepMind, Eli Collins, no contexto do julgamento antitruste que a empresa de tecnologia está enfrentando nos EUA com seu mecanismo de pesquisa, onde, de acordo com a Bloomberg, ele concordou que a organização de pesquisa "tem a capacidade de treinar em dados que os editores optaram por não treinar" especificamente para pesquisa.
Especificamente, ele explicou que isso ocorre porque os controles do Google para optar por não participar do treinamento de IA estão relacionados apenas ao Google DeepMind. Ou seja, os outros serviços da empresa podem continuar a usar esses dados para treinar seus modelos de produtos.
Deve-se observar que, de acordo com um porta-voz do Google em uma declaração ao meio de comunicação mencionado acima, os editores de sites só podem impedir que seus dados sejam usados por serviços de pesquisa de IA se especificarem que não desejam ser indexados para esses serviços por meio do padrão da Web 'robots.txt'.
Especificamente, esse padrão se baseia em um arquivo que os editores de sites podem incorporar em suas páginas para indicar aos bots e indexadores da Web se eles podem ou não rastrear o site. Portanto, eles precisam usar o 'robots.txt' especificando que não querem que a IA possa usar seus dados.
Além disso, também foi revelado durante o julgamento que o Google removeu 80 bilhões dos 160 bilhões de tokens usados na pesquisa de IA, depois de filtrar os dados dos editores que optaram por não treinar a IA do Google, reduzindo-os em 50%.
Esta notícia foi traduzida por um tradutor automático