A OpenAI anunciou hoje uma versão melhorada de seu modelo de inteligência artificial mais capaz até o momento (um que leva mais tempo para pensar nas questões), apenas um dia depois que o Google anunciou o primeiro modelo desse tipo.
O novo modelo da OpenAI chama-se o3 e substitui o o1, que a empresa lançou em setembro. Semelhante ao o1, o novo modelo gasta tempo pensando nos problemas para fornecer melhores respostas às questões que exigem raciocínio lógico passo a passo. (A OpenAI optou por omitir o nome “o2” porque já é o nome de uma operadora móvel do Reino Unido.)
“Acreditamos que este é o início da próxima fase da IA”, disse o CEO da OpenAI, Sam Altman, em uma transmissão ao vivo na sexta-feira. “Esses modelos podem ser usados para realizar tarefas cada vez mais complexas que exigem muita inferência.”
De acordo com a OpenAI, o modelo o3 tem pontuações muito mais altas do que os modelos anteriores em diversas medidas, incluindo aquelas que medem habilidades complexas relacionadas à codificação e habilidades avançadas em matemática e ciências. ARC-AGI é um benchmark projetado para testar a capacidade dos modelos de IA de raciocinar através dos problemas matemáticos e lógicos mais difíceis encontrados pela primeira vez.
O Google também está conduzindo pesquisas semelhantes. Em um post sobre o X ontem, o pesquisador do Google Noam Shazeer revelou que a empresa desenvolveu seu próprio modelo de inferência chamado Gemini 2.0 Flash Thinking. Em sua postagem, o CEO do Google, Sundar Pichai, chamou-o de “o modelo mais atencioso até agora”. O novo modelo do Google obteve uma pontuação elevada no SWE-Bench, um teste que mede as capacidades de agência de um modelo.
No entanto, o novo modelo o3 da OpenAI é 20% melhor que o1. “O3 explodiu tudo”, diz Ofir Press, pós-doutorado na Universidade de Princeton que ajudou a desenvolver o SWE-Bench. “É um aumento muito surpreendente, mas não sabemos como isso aconteceu”.
Os dois modelos de confronto direto mostram que a competição entre OpenAI e Google está mais acirrada do que nunca. É importante que a OpenAI demonstre que pode continuar a progredir para atrair mais investimentos e construir um negócio lucrativo. Enquanto isso, o Google está desesperado para mostrar que continua na vanguarda da pesquisa em IA.
O novo modelo também mostra que as empresas de IA estão cada vez mais olhando além da simples expansão dos modelos de IA para extrair deles melhor inteligência.
Segundo a OpenAI, o novo modelo virá em duas versões: o3 e o3-mini. A empresa ainda não divulgou o modelo ao público, mas afirma que solicitará inscrições de terceiros para a realização de testes.
A OpenAI também revelou hoje detalhes da tecnologia usada para orquestrar o1. Este novo método, conhecido como ajuste deliberativo, envolve o treinamento de um modelo usando um conjunto de especificações de segurança para determinar a natureza da solicitação e as respostas exclusivas que ela fornece para examinar se as proteções têm probabilidade de serem violadas. Essa abordagem torna mais difícil enganar o modelo para que ele se comporte mal porque o processo de inferência do modelo pode erradicar qualquer tentativa maliciosa.