Close Menu
  • Home
  • Crypto
    • Cryptocurrencies
    • Crypto Memes
    • Bitcoin & Ethereum
  • AI
  • DeFi
  • Exchanges
    • Trade
    • Market
  • NFT Games
  • Web3
  • Economy
  • Latest News

Subscribe to Updates

Subscribe to our newsletter and never miss our latest news

Subscribe my Newsletter for New Posts & tips Let's stay updated!

What's Hot

Sharplink adiciona 83.562 ETH, no valor de US $ 264,5 milhões, pois seu estoque total atinge 521.939 ETH

agosto 5, 2025

O Openai lançou seu primeiro modelo de peso aberto desde o GPT-2

agosto 5, 2025

Claude Fan jogou um funeral para o modelo de IA aposentado da Humanidade

agosto 5, 2025
Facebook X (Twitter) Instagram
Facebook X (Twitter) Instagram
All Web3 NewsAll Web3 News
  • Home
  • Crypto
    • Cryptocurrencies
    • Crypto Memes
    • Bitcoin & Ethereum
  • AI
  • DeFi
  • Exchanges
    • Trade
    • Market
  • NFT Games
  • Web3
  • Economy
  • Latest News
All Web3 NewsAll Web3 News
Home » Esta ferramenta investiga o modelo de inteligência da Frontier AI
AI

Esta ferramenta investiga o modelo de inteligência da Frontier AI

ForaDoPadraoBy ForaDoPadraoabril 2, 2025Nenhum comentário4 Mins Read
Facebook Twitter Pinterest LinkedIn Tumblr Email
Share
Facebook Twitter LinkedIn Pinterest Email


Embora os executivos das empresas de inteligência artificial possam querer nos dizer que a AGI está aqui, os modelos mais recentes exigem algumas aulas adicionais para ajudá -las a ficarem o mais inteligentes possível.

A Scale AI é uma empresa que desempenha um papel fundamental para ajudar as empresas de IA da Frontier a criar modelos sofisticados, desenvolvendo uma plataforma que pode testar automaticamente modelos em milhares de benchmarks e tarefas, permitindo que você sinalize dados de treinamento adicionais que o ajudarão a melhorar suas habilidades. Obviamente, a escala fornece os dados necessários.

A escala aumentou proeminentemente o trabalho humano para treinamento e teste de modelos avançados de IA. Os modelos de idiomas em larga escala (LLMS) são treinados com uma grande quantidade de texto raspado de livros, web e outras fontes. Transformar esses modelos em chatbots úteis, consistentes e bem gerenciados requer “treinamento” adicional na forma humana que fornece feedback sobre a saída do modelo.

A Escala fornece trabalhadores especializados em investigar modelos de problemas e limitações. Uma nova ferramenta chamada avaliação em escala usa algoritmos de aprendizado de máquina específicos para automatizar parte desse trabalho.

“Os grandes laboratórios têm todas essas maneiras acidentais de rastrear algumas das fraquezas do modelo”, diz Daniel Bellios, diretor de produtos da Scale Ratings. A nova ferramenta é “como (fabricantes de modelos) passam pelos resultados e correm e redimensionam para entender onde o desempenho do modelo não está funcionando bem”, diz Berrios.

Berrios diz que várias empresas de modelos de IA de fronteira já estão usando a ferramenta. Ele diz que a maioria o usa para melhorar a capacidade de raciocínio dos melhores modelos. A inferência de IA inclui modelos que tentam dividir o problema em componentes para resolvê -lo com mais eficiência. Essa abordagem depende muito do treinamento pós-treinamento dos usuários para determinar se o modelo resolveu o problema corretamente.

Em um exemplo, a classificação da escala revelou que as habilidades de inferência do modelo caíram quando foram alimentadas a um prompt que não é inglês, diz Berrios. “A capacidade de raciocínio genérico (do modelo) era muito bom e funcionou bem em benchmarks, mas tendia a se deteriorar bastante quando os avisos não estavam em inglês”, diz ele. A evolução da escala destacou esse problema e permitiu à empresa coletar e abordar dados de treinamento adicionais.

Jonathan Frankle, cientista-chefe da AI da Databricks, uma empresa que constrói modelos de IA em larga escala, diz que ser capaz de testar um modelo básico parece útil, em princípio. “Todo mundo que avança a bola com classificações ajuda a construir uma IA melhor”, diz Frankl.

Nos últimos meses, a Scale contribuiu para o desenvolvimento de vários novos benchmarks projetados para tornar os modelos de IA mais inteligentes e examinará com mais cuidado a forma como eles chateam. Isso inclui enigmabal, multichallenge, máscaras e o exame final para a humanidade.

A escala diz que está se tornando mais difícil medir melhorias nos modelos de IA. A empresa diz que sua nova ferramenta pode ser usada para criar testes personalizados dos recursos do modelo, como a combinação de vários benchmarks para fornecer uma imagem mais abrangente e investigar inferências em diferentes idiomas. A IA da Scale pega problemas específicos, gera mais exemplos e permite um teste mais abrangente das habilidades do modelo.

As novas ferramentas da empresa também podem informar os esforços para padronizar os testes de modelos de fraude de IA. Alguns pesquisadores dizem que a falta de padronização significa que os jailbreaks para alguns modelos serão privados.

Em fevereiro, o Instituto Nacional de Normas e Tecnologia anunciou que ajudaria a desenvolver metodologias para modelos de teste, para que as escalas sejam seguras e confiáveis.

Que erros você encontrou na saída da ferramenta de AI do gerador? Qual você acha que é o maior ponto cego do modelo? Informe -nos por e -mail hello@wired.com ou comentando abaixo.



Source link

Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
ForaDoPadrao
  • Website

Related Posts

O Openai lançou seu primeiro modelo de peso aberto desde o GPT-2

agosto 5, 2025

Claude Fan jogou um funeral para o modelo de IA aposentado da Humanidade

agosto 5, 2025

De acordo com Jack Dongara, como a supercomputação evolui

agosto 5, 2025

O caminhante estava faltando por quase um ano. Depois disso, o sistema de IA encontrou o capacete

agosto 4, 2025
Add A Comment
Leave A Reply Cancel Reply

Editors Picks

Pixelverse dá vida a memes criptográficos com o jogo MemeBattle

dezembro 20, 2024

3 moedas meme devem disparar antes do Natal

dezembro 18, 2024

4 melhores novas moedas meme para investir neste fim de semana, de especialistas em criptografia

dezembro 17, 2024

Esqueça o Bitcoin – a próxima estrela da criptografia tem como objetivo um aumento de 26.000% na pré-venda da moeda Meme

dezembro 16, 2024

Subscribe to Updates

Subscribe to our newsletter and never miss our latest news

Subscribe my Newsletter for New Posts & tips Let's stay updated!

All Web3 News
Facebook X (Twitter) Instagram Pinterest Vimeo YouTube
  • Home
  • Anuncie Conosco
  • Contate-nos
  • DMCA
  • Política de Privacidade
  • Sobre Nós
  • Termos e Condições
© 2025 allweb3news. Designed by allweb3news.

Type above and press Enter to search. Press Esc to cancel.