Os roboticistas europeus lançaram hoje um poderoso modelo de inteligência artificial de código aberto que funciona como o cérebro dos robôs industriais, permitindo-lhes agarrar e manipular objetos com nova destreza.
O novo modelo, SPEAR-1, foi desenvolvido por pesquisadores do Instituto Búlgaro de Ciência da Computação, Inteligência Artificial e Tecnologia (INSAIT). Poderia ajudar outros pesquisadores e startups a construir e experimentar hardware mais inteligente para fábricas e armazéns.
Da mesma forma que os modelos de linguagem de código aberto permitiram que pesquisadores e empresas experimentassem IA generativa, o cientista da computação do INSIAT e ETH Zurich, Martin Vechev, diz que o SPEAR-1 deve ajudar os roboticistas a experimentar e iterar rapidamente. “O modelo de peso aberto é fundamental para o avanço da IA incorporada”, disse Vechev à WIRED antes do lançamento.
O SPEAR-1 difere dos modelos de base de robôs existentes ao incorporar dados 3D no mix de treinamento. Isso dá ao seu modelo uma melhor compreensão do mundo físico e ajuda a entender como os objetos se movem no espaço físico.
Os modelos básicos robóticos são geralmente construídos com base em Vision Language Models (VLMs), que têm uma visão ampla e estreita do mundo físico, já que o treinamento tende a vir de imagens 2D rotuladas. “Nossa abordagem aborda a incompatibilidade entre o espaço 3D em que o robô opera e o conhecimento VLM que forma o núcleo do modelo de base do robô”, diz Vechev.
O SPEAR-1 é quase tão capaz quanto os modelos comerciais projetados para operar robôs, conforme medido pelo RoboArena, um benchmark que testa a capacidade de um modelo de fazer um robô realizar ações como apertar uma garrafa de ketchup, fechar uma gaveta ou grampear papel.
Bilhões de dólares já foram gastos na corrida para tornar os robôs mais inteligentes. O potencial comercial de robôs geralmente competentes gerou startups bem financiadas, como Skild e Generalist, além de Inteligência Física. O SPEAR-1 é quase tão bom quanto o Pi-0,5 da Physical Intelligence, uma startup de US$ 1 bilhão fundada por uma equipe renomada de roboticistas.
SPEAR-1 sugere que a busca para construir robôs mais inteligentes pode envolver modelos fechados, como OpenAI, Google e Anthropic, bem como variantes de código aberto, como Llama, DeepSeek e Qwen.
No entanto, a inteligência robótica ainda está na sua infância. Um modelo de IA pode ser treinado para operar um braço robótico para garantir que ele recupere objetos específicos de uma mesa. Porém, na prática, se um tipo diferente de braço robótico for usado, ou se o objeto ou ambiente mudar, o modelo deverá ser retreinado do zero.

