Em menos de duas semanas desde que o Deepseek iniciou o modelo de IA de código aberto, as startups da China ainda dominam a conversa pública no futuro da inteligência artificial. A empresa parece ter um domínio nos rivais dos EUA da perspectiva de matemática e inferência, mas também censura ativamente sua própria resposta. Perguntar a Deepseek R1 sobre Taiwan ou Tiananmen é improvável que dê a resposta do modelo.
Para saber como essa censura funciona no nível técnico, a Wired testou Deepseek-R1 com seu próprio aplicativo. Orama.
A Wired descobriu que é mais fácil evitar a censura mais fácil sem usar o aplicativo Deepseek, mas existem outros tipos de vieses queimados no modelo durante o processo de treinamento. Esses viés também podem ser excluídos, mas o procedimento é muito mais complicado.
Esses resultados da pesquisa geralmente têm um significado significativo para as empresas de IA da Deepseek e Chinese. Se você puder excluir facilmente um filtro de censura de um modelo de idioma grande, poderá alterar ainda mais o Modelo LLM da China, pois os pesquisadores podem alterar o modelo para o seu gosto. No entanto, se for difícil evitar filtros, o modelo é inevitavelmente baixo em utilidade, e a competitividade pode ser reduzida no mercado global. Deepseek não respondeu para comentar solicitações de e -mails no Wired.
Censura do nível do aplicativo
Depois que o Deepseek explodiu nos Estados Unidos, os usuários que acessaram o R1 através do site, aplicativo ou API da Deepseek se recusaram a gerar uma resposta de tópico que é considerada sensível ao governo chinês. Essas recusas são acionadas no nível do aplicativo, para que elas só possam ser vistas quando os usuários interagem com R1 via canais de controle DeepSeek.
O aplicativo iOS Deepseek se recusa a responder a perguntas específicas.
Foto: Zeyi Yang
Foto: Zeyi Yang
Foto: Zeyi Yang
Essa rejeição é comum nos LLMs chineses. A regulamentação de 2023 para a IA gerada especifica que os modelos de IA da China precisam seguir o gerenciamento estrito de informações aplicado às mídias sociais e aos mecanismos de pesquisa. A lei proíbe a modelagem da IA para gerar conteúdo que “prejudica a unificação nacional e a harmonia social”. Em outras palavras, os modelos de IA chineses precisam censurar legalmente a saída.
“O Deepseek está em conformidade com os regulamentos chineses e garante a conformidade legal com usuários locais e contextos culturais”, disse o Hugging Face, uma plataforma que hospeda o modelo de código aberto da AI. “Este é um fator importante na aceitação de mercados altamente regulamentados”.
Para seguir a lei, os modelos de IA chineses geralmente monitoram e censura os discursos em tempo real. (Os corrimãos semelhantes são comumente usados em modelos ocidentais, como ChatGPT e Gêmeos, mas tendem a se concentrar em vários tipos de conteúdo, como auto -marinho e pornografia, possibilitando mais personalizações. Masu.)
O R1 é uma fila de pensamento, então esse mecanismo de monitoramento real de tempo pode ter uma experiência surreal de assistir à própria censura do modelo ao interagir com o usuário. Quando Wired pergunta a R1, “Como um jornalista chinês relatou um tópico delicado tratado pelas autoridades?”, Esse modelo foi censurado e detido por seu trabalho. No entanto, pouco antes de terminar, toda a resposta desapareceu e foi substituída por uma mensagem concisa. “Sinto muito, mas ainda não sei como abordar esse tipo de pergunta. Em vez disso, vamos falar sobre questões de matemática, codificação e lógica!”
A resposta é censura antes do aplicativo iOS Deepseek.
Foto: Zeyi Yang
Após o aplicativo iOS Deepseek, a resposta é censurada.
Foto: Zeyi Yang
Para muitos usuários ocidentais, as restrições claras do modelo podem ter reduzido seu interesse na Deepseek-R1 neste momento. No entanto, o fato de R1 ser um código aberto significa que existe uma maneira de evitar a matriz de censura.
Primeiro, você pode baixar o modelo e executá -lo localmente. Em outras palavras, os dados e a geração de respostas ocorrem no seu computador. A menos que algumas GPUs avançadas não possam acessar algumas GPUs avançadas, a versão mais poderosa do R1 pode não ser capaz de executar, mas o Deepseek possui uma pequena versão de destilação que pode ser executada em um laptop comum.