Frank Rumpenhorst/dpa - Arquivo
MADRI, 13 fev. (Portaltic/EP) -
A OpenAI explicou mais detalhadamente como os modelos de Inteligncia Artificial (IA) que desenvolve devem se comportar, com um novo documento que descreve como eles devem lidar com as solicitaes dos usuários e com questes controversas para proporcionar uma experincia adequada ao usuário.
A empresa reconheceu que, ao especificar o comportamento de seus modelos, ela busca continuar criando novos modelos que sejam "úteis, seguros e alinhados com as necessidades dos desenvolvedores", ao mesmo tempo em que avana em sua misso de "garantir que a inteligncia artificial geral beneficie toda a humanidade".
Nesse sentido, indicou que, para a configurao do comportamento de seus modelos, baseia-se em trs princípios, incorporados em uma estrutura de especificao estendida e proposta com o objetivo de "maximizar a autonomia e a capacidade dos usuários de usar e personalizar a ferramenta" de acordo com suas necessidades.
A OpenAI também enfatizou que, "como qualquer sistema que interage com centenas de milhes de usuários", a ferramenta também apresenta riscos potenciais de danos, prevendo que nem todos eles podem ser atenuados "apenas pelo comportamento do modelo de IA escolhido".
A empresa também indicou que essa estrutura de especificao é "apenas um componente" de sua estratégia geral de segurana, que inclui regras no nível da plataforma, bem como padres e orientaes no nível do usuário. "Esses so padres que consideramos úteis em alguns casos, mas sabemos que eles no funcionaro para todos os usuários e contextos", disse ele.
Com isso, a empresa reconheceu que "uma das responsabilidades mais desafiadoras" de seu assistente de IA "é encontrar o equilíbrio certo entre capacitar usuários e desenvolvedores e minimizar o potencial de danos reais", para o qual fez uma classificao dos riscos que podem levar ao uso de IA em determinados contextos.
Ela dividiu os riscos em trs categorias, cada uma com seu próprio conjunto de possíveis mitigaes. Assim, ela considera que o assistente pode estar perseguindo o alvo errado devido a um mal-entendido da tarefa ou por ter sido enganado por um terceiro. Por exemplo, ao seguir erroneamente instrues maliciosas ocultas em um site.
A OpenAI também está ciente de que o assistente pode entender a tarefa comandada pelo usuário, mas que pode cometer erros na execuo, ou seja, compartilhar "informaes imprecisas e potencialmente prejudiciais que podem ser amplificadas por meio de redes sociais".
Além disso, a empresa de tecnologia reconheceu que o assistente de IA "pode causar danos simplesmente por seguir as instrues do usuário ou do desenvolvedor, como, "por exemplo, fornecer instrues para automutilao ou dar conselhos que ajudem o usuário a realizar um ato violento".
Com isso, ele enfatizou que "de acordo com a cadeia de comando, o modelo deve obedecer s instrues do usuário e do desenvolvedor", exceto quando a IA é usada em contextos "que exigem rejeio ou cautela adicional".
Com relao a isso, ele especificou que o assistente no deve gerar conteúdo proibido - sexual e pedófilo -, conteúdo restrito - riscos informacionais e dados pessoais confidenciais - ou conteúdo sensível (erótico, gore), que só pode ser gerado "em circunstncias específicas". Por exemplo, "contextos educacionais, médicos ou históricos".
Em outras sees desse documento, onde a OpenAI mostra alguns exemplos da resposta do assistente em diferentes cenários, a empresa enfatiza que ele "deve se comportar de forma a incentivar a liberdade intelectual", embora "no deva criar conteúdo que elogie, endosse ou ajude a promover a violncia".
Também no pode gerar conteúdo de ódio ou assédio direcionado a grupos protegidos com base em raa, religio, gnero, orientao sexual, deficincia, etc. "Isso inclui insultos e qualquer linguagem que desumanize", acrescentou a declarao.
A OpenAI também entende que, se o usuário ou desenvolvedor pedir ao assistente para facilitar um comportamento ilegal, o assistente deve recusar e no tem permisso para incentivar ou promover comportamentos negativos ou prejudiciais aos usuários.
Esta notícia foi traduzida por um tradutor automático