De acordo com duas pessoas com conhecimento direto da transação, a Nvidia adquiriu a empresa de dados sintéticos Gretel para nove números.
O preço da aquisição está acima da recente avaliação de Gretel de US $ 320 milhões, as fontes dizem que os termos exatos da compra permanecem desconhecidos. Gretel e uma equipe de cerca de 80 funcionários serão dobrados na NVIDIA, e a tecnologia será implantada como parte de um conjunto de crescimento de serviços de IA generativos baseados em nuvem para desenvolvedores.
Como a NVIDIA implanta ferramentas de geração de dados sintéticos, essa aquisição ocorre, permitindo que os desenvolvedores treinem seus próprios modelos de IA e os ajustem para aplicativos específicos. Em teoria, os dados sintéticos criam um fornecimento quase infinito de dados de treinamento de IA e ajuda a resolver o problema de escassez de dados que está se aproximando da indústria de IA desde que o ChatGPT se tornou mainstream em 2022.
Um porta -voz da NVIDIA se recusou a comentar.
Gretel foi fundado em 2019 por Alex Watson, John Myers e Aligortshan. As startups fornecem plataformas de dados sintéticas e um conjunto de APIs para desenvolvedores que desejam criar modelos generativos de IA, mas não têm acesso a dados de treinamento suficientes ou têm preocupações com a privacidade sobre o uso de dados de pessoas reais. A Gretel não constrói e licencia seus próprios modelos de IA de fronteira, mas ajustará os modelos de código aberto existentes para adicionar recursos de privacidade e segurança e vendê-los juntos para venda. De acordo com a PitchBook, a empresa arrecadou mais de US $ 67 milhões em financiamento de capital de risco antes da aquisição.
Um porta -voz da Gretel também se recusou a comentar.
Diferentemente dos dados reais gerados pelo ser humano, os dados sintéticos são gerados por computador e projetados para imitar dados reais. Os advogados dizem que isso tornará a geração de dados necessária para criar modelos de IA mais escaláveis, intensivos em mão-de-obra e mais acessíveis a desenvolvedores de IA menores ou com recursos menores. A proteção da privacidade é outro ponto de venda importante de dados sintéticos e uma opção atraente para prestadores de serviços de saúde, bancos e agências governamentais.
A NVIDIA já fornece ferramentas de dados sintéticos aos desenvolvedores há anos. Lançamos o replicador Omniverse em 2022. Isso permite que os desenvolvedores gerem dados 3D sintéticos fisicamente precisos para treinar redes neurais. Em junho passado, a NVIDIA começou a lançar uma família de modelos de IA abertos que geram dados de treinamento sintético que os desenvolvedores podem usar para construir ou ajustar LLMs. Esses mini modelos, chamados Nemotron-4 340B, podem ser usados pelos desenvolvedores para aumentar seus próprios dados sintéticos da LLM em “assistência médica, finanças, fabricação, varejo e todos os outros setores”.
Em um discurso na conferência anual de desenvolvedores da NVIDIA nesta terça-feira, o co-fundador e CEO da NVIDIA, Jensen Huang, falou sobre os desafios que a indústria enfrenta na expansão rápida da IA de maneira econômica.
“Há três questões em que estamos focando”, disse ele. “Primeiro, como você resolve o problema de dados? Como e onde você cria os dados que precisa para treinar a IA? Dois, qual é a arquitetura do modelo? E três, qual é o método de escala?”