Mesmo depois que todas as quatro pernas invadidas por uma serra elétrica são invadidas, o robô de quatro patas continua cru, tornando-o um pesadelo para a maioria das pessoas.
Para Deepak Pathak, co-fundador e CEO da startup Skild AI, o feito de adaptação distópica é um sinal inspirador para uma inteligência de robô mais comum e mais comum.
“É isso que chamamos de cérebro de um omniborpo”, diz Patak. Sua startup desenvolveu algoritmos de inteligência artificial generalista para enfrentar os principais desafios em relação aos avanços na robótica.
Muitos pesquisadores acreditam que os modelos de IA usados para controlar os robôs podem experimentar saltos avançados, assim como aqueles que geraram modelos de idiomas e chatbots, se puderem coletar dados de treinamento suficientes.
Os robôs controlados pela IA podem se adaptar a novas situações extremas, como a perda de membros.
Métodos existentes para treinar modelos de IA robótica, como aprendizado de algoritmos para controlar sistemas específicos com manipulação e simulação de teleo, não geram dados suficientes, diz Pathak.
A abordagem de Skild é treinar um único algoritmo para controlar muitos robôs físicos diferentes em uma ampla gama de tarefas. Com o tempo, isso gera o que a empresa chama de Skild Brain. Os pesquisadores criaram uma versão menor do modelo, chamada LocoFormer, para um artigo acadêmico que descreve a abordagem.
Este modelo foi projetado para se adaptar rapidamente a novas situações, como pernas ausentes e novos terrenos perigosos, encontrando maneiras de aplicar o que você aprendeu a novas situação. Pathak compara a abordagem de como um modelo linguístico em larga escala assume questões particularmente desafiadoras, dividindo-a e trazendo deliberações de volta à sua própria janela de contexto.
Outras empresas, incluindo startups rivais chamadas Toyota Research Institute and Physical Intelligence, também estão competindo para desenvolver modelos de IA robot mais capazes. No entanto, é incomum como o SKILD cria um modelo que generaliza para tantos tipos diferentes de hardware.
O LOCOFORMER é treinado em grandes RLs de vários robôs gerados processualmente com randomização agressiva do domínio.
Cortesia de Scild
Em um experimento, a equipe do SKILD treinou um algoritmo para controlar vários robôs de caminhada de várias formas. Quando o algoritmo foi executado em um robô de duas pernas (um sistema não incluído nos dados de treinamento), ele foi capaz de andar com o controle do movimento.
A certa altura, a equipe descobriu que um robô de quatro patas que administra os omniborpos da empresa se adapta assim que é colocado em suas patas traseiras. Para sentir o chão sob as patas traseiras, o algoritmo manipula o cachorro robótico como se fosse humanóides e caminha suas patas traseiras.
O LocoFormer aprende continuamente através de experiências on -line. Essa política pode ser aprendida com quedas nos exames iniciais para melhorar as estratégias de teste posteriores.
Cortesia de Scild
Os algoritmos generalistas também podem adaptar mudanças extremas à forma do robô. Por exemplo, se as pernas estiverem amarradas, cortadas ou modificadas para serem mais longas. A equipe também tentou desativar dois motores com não apenas pernas, mas rodas e robôs quadriftos. O robô foi capaz de se adaptar equilibrando duas rodas como uma bicicleta instável.
Quando confrontado com grandes interferências, como mudanças morfológicas, distúrbios de movimento ou mudanças de peso, o LocoFormer pode reconstruir essas representações para obter adaptação on -line.
Cortesia de Scild
Skild está testando a mesma abordagem para manipulação de robôs. Treinamos o cérebro da esfera na linha de braços robóticos simulados e descobrimos que o modelo resultante poderia controlar o hardware desconhecido e se adaptar a mudanças repentinas no ambiente, como a iluminação reduzida. A startup já está trabalhando com algumas empresas que usam armas robóticas, diz Pathak. Em 2024, a empresa levantou US $ 300 milhões na rodada, avaliou a empresa em US $ 1,5 bilhão.
Pathak diz que o resultado pode parecer assustador para alguns, mas para ele eles mostram uma espécie de faísca de tensão física do robô. “É pessoalmente muito emocionante”, diz ele.
O que você acha do versátil robô do Skild Brain? Envie um e -mail para ailab@wired.com.
Esta é uma edição do boletim de Will Knight’s Ai Lab. Leia nossa newsletter anterior aqui.

