A Openai perdeu seu primeiro modelo de peso aberto em mais de cinco anos. Os dois modelos de idiomas, o GPT-120B e o GPT-20B, correm localmente em dispositivos de consumo e podem ser ajustados para fins específicos. No caso do OpenAI, representa uma mudança de uma estratégia recente de focar em seus próprios lançamentos, à medida que se move para um grupo mais aberto e aberto de modelos de IA disponíveis para os usuários.
“Este modelo é o resultado de um estudo de bilhões de dólares e estamos entusiasmados em disponibilizar a IA para a maioria das pessoas”, disse o CEO da Openai, Sam Altman, em um email. Tanto o GPT-OSS-120B quanto o GPT-20B podem ser baixados gratuitamente no Hugging Face, uma plataforma de hospedagem popular para ferramentas de IA. O último modelo de peso aberto lançado pelo OpenAI foi o GPT-2 em 2019.
O que diferencia o modelo de peso aberto é o fato de que seus “pesos” são públicos. Isso significa que qualquer pessoa pode espiar parâmetros internos para entender como processar as informações. Em vez de cortar o próprio modelo do OpenAI com uma opção gratuita, o co-fundador Greg Brockman considera este lançamento “complementar” aos serviços pagos da empresa, incluindo as interfaces de programação de aplicativos que muitos desenvolvedores usam atualmente. “O modelo de peso aberto tem forças muito diferentes”, disse Brockman durante um briefing com um repórter. Ao contrário do ChatGPT, você pode executar o modelo GPT-OSS atrás do firewall sem se conectar à Internet.
Ambos os modelos GPT usam uma abordagem de inferência de mentalidade de cadeia que o OpenAI divulgou pela primeira vez no modelo O1 no outono passado. Essa abordagem permite que as ferramentas genéricas de IA sigam várias etapas e respondam aos avisos, em vez de simplesmente fornecer saída. Esses novos modelos somente de texto não são multimodais, mas você pode navegar na Web, chamar modelos baseados em nuvem para ajudar nas tarefas, executar código e navegar no software como agente de IA. Dos dois modelos, o pequeno GPT-20B é compacto o suficiente para ser executado localmente em dispositivos de consumo com 16 GB ou mais de memória.
Dois novos modelos de OpenAI estão disponíveis sob a licença Apache 2.0, que é popular para modelos de peso aberto. O Apache 2.0 permite que os modelos sejam usados para fins comerciais, redistribuídos e incluídos como parte de outro software licenciado. O modelo de peso aberto foi liberado do Qwen do Alibaba e Mistral também é executado no Apache 2.0.
O lançamento desses modelos abertos, lançado em março, foi adiado pela primeira vez para testes de segurança adicionais. A liberação de um modelo de peso aberto é potencialmente mais perigoso que a versão fechada, pois remove as barreiras em torno daqueles que podem usar a ferramenta.
Além das classificações que normalmente são executadas em seus próprios modelos, o OpenAI também tem opções de peso aberto personalizadas para ver como isso pode ser explorado por “maus atores” que baixam a ferramenta. “Na verdade, ajustamos o modelo internamente em algumas dessas áreas de risco”, diz Eric Wallace, pesquisador de segurança da Openai. No teste do OpenAI, o modelo de peso aberto não atingiu um alto nível de risco, conforme medido por sua estrutura de preparação.