Sam Altman anunciou hoje que o Openai lançará um modelo de inteligência artificial de peso aberto nos próximos meses.
“Estamos ansiosos para lançar um poderoso novo modelo de idioma aberto com inferência nos próximos meses”, escreveu o CEO X.
A mudança faz parte da resposta ao sucesso de tumulto do modelo R1 da empresa chinesa Deepseek e à popularidade do modelo de lhama de Meta.
Logo após o lançamento do modelo Deepseek em janeiro, Altman afirmou que o Openai estava “do lado errado da história” em relação ao modelo aberto, indicando a possibilidade de uma mudança de direção. Na segunda -feira, ele disse que a empresa está pensando em lançar um modelo de peso aberto há algum tempo, acrescentando que “é importante agora”.
O Openai pode sentir a necessidade de mostrar que novos modelos podem ser treinados baratos, pois os modelos Deepseek são supostamente treinados a alguns dos custos da maioria dos grandes modelos de IA.
“Esta é uma ótima notícia”, disse Clement Delangue, co-fundador e CEO da Huggingface, especializado em hospedar modelos abertos de IA, Wired. “Com o Deepseek, todos reconhecem o poder do peso aberto”.
Agora, o OpenAI disponibiliza a IA no Chatbots e na nuvem. R1, LLAMA e outros modelos de peso aberto estão disponíveis para download para modificação gratuita. Os pesos do modelo se referem a valores em uma grande rede neural. Isso é o que é definido durante o treinamento. O modelo de peso aberto é barato de usar e também pode ser adaptado a um caso de uso sensível, como o processamento de informações sensíveis avançadas.
Steven Heidel, membro da equipe técnica do Openai, repositou o anúncio de Altman, acrescentando: “Estamos lançando modelos que podem executar em nosso próprio hardware”.
Johannes Heidecke, pesquisador que trabalha na segurança da IA no Openai, também repositou a mensagem X, acrescentando que a empresa estará realizando testes rigorosos para impedir que o modelo de peso aberto seja mal utilizado. Alguns pesquisadores de IA temem que os modelos de peso aberto ajudem os criminosos a lançar ataques cibernéticos e desenvolver armas biológicas ou químicas. “Os modelos abertos apresentam desafios únicos, mas somos guiados por uma estrutura de preparação e não lançaremos os modelos.
O OpenAI publicou hoje uma página da web, convidando os desenvolvedores a se inscrever para o acesso antecipado aos próximos modelos. Em seu post, Altman disse que a empresa realizará um evento para desenvolvedores com protótipos iniciais do novo modelo nas próximas semanas.
A Meta lançou a primeira versão da LLama em julho de 2023 e foi a primeira grande empresa de IA a seguir uma abordagem mais aberta. Um aumento nos modelos de IA de peso aberto já está disponível. Alguns pesquisadores observam que a lhama e outros modelos não são o mais transparentes possível, pois os dados de treinamento e outros detalhes permanecem em segredo. A Meta também impõe uma licença que limita a capacidade de outras empresas se beneficiarem de aplicativos e ferramentas construídas usando a lhama.
Atualizado em 31 de março de 2025, 4:21 EST: Este artigo foi atualizado com um comentário da Clement Delangue, co-fundador e CEO da HuggingFace.