A Nvidia anunciou hoje o lançamento de uma família de modelos fundamentais de IA chamada Cosmos, que pode ser usada para treinar humanóides, robôs industriais e carros autônomos. Enquanto os modelos de linguagem são treinados em grandes volumes de livros, artigos e postagens em mídias sociais para aprender como gerar texto, o Cosmos é projetado para gerar imagens e modelos 3D do mundo físico.
Em sua palestra na conferência anual CES em Las Vegas, o CEO da Nvidia, Jensen Huang, deu um exemplo do Cosmos sendo usado para simular atividades dentro de um armazém. O Cosmos foi treinado em 20 milhões de horas de imagens reais de “humanos andando, movendo as mãos e manipulando objetos”, disse Jensen. “Não se trata de gerar conteúdo criativo, trata-se de ensinar a IA a compreender o mundo físico.”
Pesquisadores e startups esperam que esse tipo de modelo básico dê aos robôs usados em fábricas e residências capacidades ainda mais avançadas. Por exemplo, o Cosmos pode gerar vídeos realistas de caixas caindo das prateleiras de um armazém, que podem ser usados para treinar robôs para reconhecer acidentes. Os usuários também podem usar seus próprios dados para ajustar o modelo.
A Nvidia diz que várias empresas já estão usando o Cosmos, incluindo startups de robôs humanóides Agility e Figure AI, bem como empresas de automóveis autônomos como Uber, Waabi e Wave.
Exemplo de filmagem de armazém gerada pelo Cosmos.
Fornecido pela NVIDIA
A Nvidia também anunciou um software projetado para ajudar diferentes tipos de robôs a aprenderem a realizar novas tarefas com mais eficiência. Este novo recurso faz parte da plataforma existente de simulação de robôs Isaac da Nvidia, que permite aos construtores de robôs pegar um pequeno número de exemplos da tarefa desejada, como agarrar um objeto específico, e gerar grandes quantidades de dados de treinamento sintéticos.
A Nvidia espera que Cosmos e Isaac atraiam empresas que desejam construir e usar robôs humanóides. Juntando-se a Jensen no palco da CES estavam imagens em tamanho real de 14 robôs humanóides diferentes desenvolvidos por empresas como Tesla, Boston Dynamics, Agility e Figure.
Junto com o Cosmos, a Nvidia também anunciou o Project Digits, um “supercomputador pessoal de IA” de US$ 3.000 que pode executar grandes modelos de linguagem de até 200 bilhões de parâmetros sem a necessidade de serviços em nuvem como AWS ou Microsoft. Também anunciamos as tão esperadas GPUs RTX Blackwell de próxima geração e as próximas ferramentas de software para ajudá-lo a criar agentes de IA.