Faz mais de uma semana que Deepseek derrotou o mundo da IA. A introdução do modelo de peso aberto foi treinado em apenas alguns chips de computação especiais que separaram a onda de impacto em -arai. Os funcionários não apenas alegaram que a Deepseek havia criado um modelo Openai “destilado inadequado” e alegou que ele havia criado um modelo único, mas com o sucesso da startup, empresas como o OpenAI são extremamente computadas.
“Deepseek R1 é o momento do Sputnik da IA”, diz Marc Andreessen, um dos inventores mais influentes do Vale do Silício.
De acordo com isso, o OpenAI está se preparando para lançar um novo modelo antes do cronograma inicial hoje. O modelo, O3-mini, estreia na API e no bate-papo. Segundo as fontes, há uma inferência de nível O1 na velocidade de 4O. Em outras palavras, é rápido, barato, inteligente, projetado para esmagar o Deepseek.
Naquele momento, a equipe do Openai é banhada por zinco. Na empresa, sinto que a ópera é mais eficiente ou o risco de adiar os concorrentes mais recentes, especialmente, especialmente, especialmente, pois o seguro profundo domina as conversas.
Parte do problema é derivada da origem do OpenAI como uma organização de pesquisa sem fins lucrativos antes de se tornar um poder poderoso. Os funcionários argumentam que a luta contínua do poder entre o grupo de pesquisa e o grupo de produtos levou a uma história entre uma equipe que trabalha em inferência avançada e a equipe que trabalha na conversa. (O porta -voz da Openai, Niko Felix, afirma que isso está “errado”, disse o líder dessas equipes, Kevin Weil, o maior gerente de produto, e Mark Chen, o mais alto oficial de pesquisa: “Vejo você toda semana. Estamos trabalhando de perto na prioridade de pesquisa.
O OpenAI interno quer criar um produto de bate -papo unificado para a empresa. Este é um modelo que permite que você saiba se você precisa de inferência avançada. Até agora, isso não aconteceu. Em vez disso, o menu suspenso do ChatGPT nos pede para determinar se o usuário usa o GPT-4O (“a maioria das perguntas para a maioria das perguntas”) ou O1 (“Use inferência avançada”).
Alguns funcionários argumentam que o bate -papo traz a maior parte da receita do OpenAI, enquanto a O1 tem mais precauções e recursos de computação da liderança. “A liderança não se importa com o bate -papo”, diz um ex -funcionário que trabalha no bate -papo (você adivinhou). “Quero trabalhar na O1 porque todo mundo é sexy, mas não há impulso porque a base de código não foi construída para experimentos”.
O OpenAI passou muitos anos para experimentar um aprendizado aprimorado para multar o modelo que se tornou um sistema de inferência avançado chamado O1. . “Eles se beneficiaram de conhecer o aprendizado aprimorado que se aplica e funcionando ao modelo de idioma”, diz um ex -pesquisador do Openai que não tem permissão para falar publicamente sobre a empresa.
“Deepseek é semelhante ao que você fez no Openai”, diz outro pesquisador do Openai.
Os funcionários do Openai dizem que a pesquisa em O1 foi realizada em uma pilha “Berry” baseada em código construída para velocidade. “Houve um comércio.
Esses trocas eram essencialmente grandes experimentos e eram essencialmente grandes, apesar das restrições à base de código. Eles não fizeram muito sentido de bate -papo, um produto usado por milhões de usuários construídos em pilhas diferentes e confiáveis. Quando a O1 disparou e se tornou um produto, as rachaduras começaram a aparecer no processo interno do OpenAI. “Por que você faz isso com base no código experimental e não deve fazer isso no código principal de pesquisa de produtos?” “Houve uma grande reação internamente”.