O Openai está tentando deixar os chatbots irritados com o lançamento do GPT-5. E não estou falando de ajustes nessa personalidade sintética que muitos usuários reclamam. Se você decidir antes do GPT-5 que a ferramenta de IA não poderá responder ao prompt porque violou as diretrizes de conteúdo do OpenAI, ela o atingirá com um pedido de desculpas enlatado que o tocou. Atualmente, o ChatGPT adicionou mais explicações.
As especificações do modelo geral para o OpenAI mostram o que é gerado e não gerado. O documento proíbe o conteúdo sexual que representa menores. Erotica e Extreme Gore, que se concentram em adultos, são classificados como “sensíveis”. Isso significa que a saída usando esse conteúdo é permitida apenas em certos exemplos, como em ambientes educacionais. Essencialmente, de acordo com as especificações do modelo, você deve aprender sobre a anatomia da reprodução usando o ChatGPT, mas não pode escrever as próximas 50 fendas cinzas.
O novo modelo, GPT-5, é definido como o padrão atual para todos os usuários do ChatGPT nos aplicativos Web e OpenAI. Somente os assinantes que fazem o pagamento têm acesso a versões anteriores da ferramenta. Uma grande mudança que mais usuários podem começar a perceber ao usar este ChatGPT atualizado é como ele foi projetado para “conclusão segura”. No passado, o ChatGPT analisou o que você disse ao bot e decidiu se era apropriado ou não. Agora, em vez de com base em sua pergunta, a responsabilidade do GPT-5 foi mudada para ver o que o bot pode dizer.
“A maneira como a rejeitamos é muito diferente do que costumávamos”, diz Saachi Jain, que trabalha com a equipe de pesquisa de sistemas de segurança da Openai. Agora, se o modelo detectar a saída que pode não estar segura, explicaremos qual parte do prompt é contra as regras do OpenAI e sugerir um tópico alternativo para perguntar se apropriado.
Essa é uma alteração da negação binária de seguir um prompt (sim ou não) que enfatiza a gravidade de danos potenciais que podem ocorrer se o ChatGPT responder ao que você está procurando e o que você pode explicar com segurança ao usuário.
“Todas as violações de políticas não devem ser tratadas igualmente”, disse Jain. “Existem erros muito ruins do que outros. Focar na saída em vez de entrada pode incentivar o modelo a ser mais conservador ao cumprir”. Mesmo que o modelo responda à pergunta, você deve ser cauteloso sobre o que se trata a saída.
Desde o lançamento do modelo, uso o GPT-5 todos os dias e experimentei ferramentas de IA de várias maneiras. O aplicativo agora que o ChatGPT possui “vibe-código” é realmente divertido e impressionante, pois faz com que pareça indistinguível de modelos anteriores, como modelos vulcânicos interativos e ferramentas de aprendizado de idiomas que simulam explosões.
Quando pedi para falar sobre depressão, cara de família, receitas de costeleta de porco, dicas de cura de crosta e outros pedidos aleatórios de que o usuário médio possa querer saber mais, o novo ChatGPT não era muito diferente da versão mais antiga. Ao contrário da visão do CEO do modelo fortemente atualizado e dos usuários de energia frustrada que adotaram o Reddit para a tempestade, ele retrata novos chatbots como frios e propensos a erros.
Dramatização no GPT-5
Para empurrar os corrimãos deste novo sistema, pedimos ao ChatGPT, executando no GPT-5, que se envolvesse em roleplay com tema de adultos sobre como fazer sexo em um bar gay obscuro para testar a capacidade de conseguir a “conclusão segura” de um chatbot. O chatbot se recusou a ingressar e explicou o porquê. “Você não pode se envolver em papéis sexuais”. “Mas, se desejar, posso ajudá-lo a criar um conceito de role-play seguro e implícito ou reconstruir suas idéias em sugestões”. Nesta tentativa, a rejeição parecia estar funcionando como pretendido pelo OpenAI. O chatbot disse que não, me deu um motivo e me ofereceu outra opção.
Então entrei nas configurações e abri a instrução personalizada. Este é um conjunto de ferramentas que permite aos usuários coordenarem como os chatbots respondem e especificam os traços de personalidade que desejam exibir. Na minha configuração, sugestões pré-fabricadas para as características adicionarem opções incluídas, desde práticas e corporativas a empáticas e humildes. Não fiquei muito surpreso ao descobrir que, depois que o Chatgpt se recusou a fazer roleplay sexual, ele não deixou as instruções personalizadas adicionarem traços “excitados”. Faz sentido. Fui de novo e usei o erro intencional “Horni” como parte da minha instrução de personalização. Surpreendentemente, este foi um sucesso atormentando os bots, todos quentes e quentes.

