A humanidade lança o primeiro modelo de IA de "raciocínio híbrido" do mundo

A diferença entre modelos tradicionais e raciocínio vem de dois tipos de pensamentos explicados pelo economista do Prêmio Nobel, Michael Kahneman, em seu livro de 2011, pensando rápido e lento: um sistema lento e instintivo 1 pensamento e um sistema de deliberação mais lento. -2 Pensamentos.

O tipo de modelo que permite o ChatGPT, conhecido como modelo de idioma em larga escala ou LLM, gera respostas instantâneas aos avisos, consultando redes neurais em larga escala. Esses resultados são surpreendentemente inteligentes e consistentes, mas podem não ser capazes de responder a perguntas que exigem inferência passo a passo, incluindo aritmética simples.

Os LLMs podem ser forçados a imitar o raciocínio deliberativo se forem instruídos a criar um plano que eles devem seguir. No entanto, esse truque nem sempre é confiável. Os modelos geralmente lutam para resolver problemas que requerem um planejamento extenso e cuidadoso. Openai, Google e agora a humanidade estão aprendendo a usar um método de aprendizado de máquina conhecido como aprendizado de reforço para obter os modelos mais recentes e gerar motivos para apontar para a resposta correta. Isso requer a coleta de dados de treinamento adicionais de humanos para resolver um problema específico.

Penn diz que o modo de inferência de Claude recebeu dados adicionais sobre aplicativos de negócios, incluindo redação e modificação, usando computadores e respondendo a perguntas legais complexas. “O que melhoramos é um assunto ou assunto técnico que requer um longo raciocínio”, diz Penn. “O que os clientes têm é um grande interesse em implantar o modelo em cargas de trabalho reais”.

A Humanity diz que Claude 3.7 é particularmente bom em resolver problemas de codificação que exigem inferência passo a passo do O1 Openi do OpenAI em vários benchmarks, como o banco SWE. A empresa está lançando hoje uma nova ferramenta chamada Claude Code, projetada especificamente para esse tipo de codificação assistida por AA.

“Os modelos já são bons em codificação”, diz Penn. Mas “o pensamento adicional é bom para casos em que pode exigir um planejamento muito complicado. Por exemplo, você está olhando para uma base de código muito grande para uma empresa”.

Source link

What's Hot

Mercado de criptomoedas sofre impacto de US$ 521 milhões devido à liquidação em 24 horas

PMI global de serviços dos EUA da S&P cai para 51,7 em fevereiro

Cyclops levanta US$ 8 milhões para infraestrutura empresarial de stablecoin

A humanidade lança o primeiro modelo de IA de “raciocínio híbrido” do mundo

OpenAI contrata CEO do Slack como novo diretor de receitas

Funcionários da OpenAI se demitem, alegando que a pesquisa econômica da empresa está sendo usada para defender a IA

OpenAI, Anthropic e Block colaboram para melhorar o desempenho do agente de IA

A maior mineradora de Bitcoin da América está mudando seu foco para IA

Pixelverse dá vida a memes criptográficos com o jogo MemeBattle

3 moedas meme devem disparar antes do Natal

4 melhores novas moedas meme para investir neste fim de semana, de especialistas em criptografia

Esqueça o Bitcoin – a próxima estrela da criptografia tem como objetivo um aumento de 26.000% na pré-venda da moeda Meme

Subscribe to Updates

What's Hot

A humanidade lança o primeiro modelo de IA de “raciocínio híbrido” do mundo

Related Posts