Hannes P Albert/dpa - Arquivo
MADRI 18 abr. (Portaltic/EP) -
O ChatGPT aprimorou sua capacidade de analisar imagens com os modelos de raciocínio OpenAI o3 e o4-mini a ponto de poder identificar a direção exata em que uma determinada fotografia foi tirada.
Os novos modelos da OpenAI vêm com dois novos recursos: comportamento autônomo, semelhante ao de um agente, e a capacidade de "pensar com imagens", ou seja, de entender o conteúdo de uma imagem e integrar informações visuais diretamente em sua cadeia de raciocínio.
Juntos, esses recursos impulsionam um recurso que o ChatGPT não tinha até agora: identificar onde uma foto foi tirada. Eles fazem isso em uma pesquisa de "adivinhação geográfica", como o especialista em inteligência artificial Ethan Mollick chamou em seu perfil no X (antigo Twitter).
Mollick destaca a capacidade do o3 de "ampliar imagens, realizar pesquisas na Web e ler textos", o que permite que o novo modelo encontre elementos na fotografia que forneçam pistas para estabelecer coletivamente uma localização.
O próprio chatbot decompõe seu processo de raciocínio com a imagem até chegar ao local que oferece com um endereço e um mapa, para que possa ser verificado.
Esta notícia foi traduzida por um tradutor automático