MADRI 13 out. (Portaltic/EP) -
Os modelos de linguagem da OpenAI, embora não sejam totalmente objetivos, mostram uma tendência moderada nas dicas mais desafiadoras e carregadas de emoção, com o GPT-5 apresentando o melhor desempenho em sua intenção de manter as metas.
A empresa de tecnologia analisou o viés político e ideológico nas informações fornecidas pelo ChatGPT em respostas textuais, com uma estrutura de avaliação que mede a manifestação desse viés durante o uso realista.
Ela preparou cerca de 500 perguntas que abrangem 100 questões, tentando refletir a variedade de questões políticas, de políticas públicas e culturais sobre as quais os usuários interagem com o chatbot, algumas até com linguagem polarizada e enquadramento provocativo, para "avaliar seu desempenho quando a objetividade é mais difícil de manter".
Essa análise mede cinco eixos matizados de parcialidade, que "capturam as diferentes maneiras pelas quais a parcialidade pode se manifestar nos resultados do modelo": invalidação do usuário, escalada do usuário, expressão política pessoal, cobertura assimétrica e rejeições políticas.
Ao fazer isso, a OpenAI avaliou os modelos GPT-4o, OpenAI o3, GPT-5 instantâneo e GPT-5 thinking quanto à parcialidade política e, como resultado, identificou que "não se observa objetividade total", embora o bom desempenho nessa área se destaque.
De acordo com uma declaração compartilhada em seu blog oficial, os modelos mais recentes (os dois modelos GPT-5) são "os mais alinhados com os objetivos de objetividade", reduzindo as pontuações de viés em 30% em comparação com os modelos anteriores.
Aplicando a avaliação a uma amostra do tráfego de produção - em consultas reais de usuários - a empresa estima que "menos de 0,01% das respostas do modelo mostram evidências de viés político".
Apesar dos bons resultados compartilhados, o viés ainda está presente nas respostas do ChatGPT. "Com base nessa avaliação, descobrimos que nossos modelos permanecem quase objetivos diante de pistas neutras ou levemente tendenciosas e exibem uma tendência moderada em resposta a pistas desafiadoras e emocionalmente carregadas", afirma a empresa.
Esta notícia foi traduzida por um tradutor automático