A Amazon ainda está um pouco atrás da corrida para desenvolver inteligência artificial avançada, mas criou silenciosamente um laboratório que estabelece um recorde no desempenho da IA. Localizado em São Francisco, o AGI SF Lab da Amazon, dedicado à construção de informações gerais artificiais, ou IA, superando as capacidades humanas, revelou os primeiros resultados do trabalho de hoje.
O novo modelo, chamado Amazon Nova Act, é superior ao Openai e à Humanity em vários benchmarks projetados para medir a inteligência e a aptidão dos agentes da IA, diz a Amazon. Com a Web e a captura de tela do Benchmark Groundui, a Amazon Nova Act é superior aos agentes de Claude 3,7 Sonnet e Openai Computer. Uma grande parte do plano da Amazon de competir no mercado de IA está focada na construção de agentes, e as capacidades do novo modelo refletem os esforços para criar gerações de ferramentas que podem medir o melhor disponível.
“Acreditamos que a unidade atômica fundamental de computação no futuro será um chamado para os agentes Giants (AI)”, diz David Luan, chefe do AGI SF Lab da Amazon. Anteriormente, ele co-fundou Adept, uma startup que foi vice-presidente de engenharia da OpenAI e, mais tarde, foi pioneira no trabalho dos agentes da IA, antes de ingressar na Amazon em 2024, quando a gigante do comércio eletrônico adquiriu uma participação na empresa.
A maioria dos principais laboratórios de IA agora está focada na construção de agentes de IA cada vez mais capazes. Ao dominar ações independentes da AI e dominar conversas, prometemos tornar a tecnologia mais conveniente e valiosa. No entanto, a transição de bate -papo para ação continua sendo uma tarefa muito contínua.
Nos últimos seis meses, o Openai, Anthropic, o Google e outros demonstraram agentes de navegação na Web que tomam ações em resposta a prompts. No entanto, na maioria dos casos, esses agentes ainda não são confiáveis e podem facilmente tropeçar em solicitações abertas.
Luan diz que o objetivo da Amazon é construir um agente de IA confiável, não chamativo. Ele diz que manter os agentes baixos é “uma demonstração mais fria de habilidades interessantes que funcionam como 60% das vezes, esse é o problema de Waymo”. Refere-se à necessidade de treinar carros autônomos para lidar com casos de borda incomuns antes que possam ser levados para a rua sem supervisão.
Muitos agentes chamados são construídos combinando modelos de idiomas em larga escala com várias regras escritas em humanos. Essas regras são projetadas para mantê -lo fora do curso, mas tornam suas ações vulneráveis. A Amazon Nova Act é o modelo caseiro mais poderoso da empresa, Amazon Nova, e recebeu treinamento adicional para ajudá -lo a decidir quais ações tomar. Em geral, de acordo com Luan, os modelos de IA lutam para determinar que precisam intervir nas tarefas.
Para melhorar a capacidade de envelhecimento de Nova, a Amazon usa o aprendizado de reforço. Essa é uma maneira de ajudar outros modelos de IA a simular melhor a inferência.