Os modelos modernos de IA são surpreendentemente semelhantes aos humanos em sua capacidade de gerar texto, áudio e vídeo em resposta a solicitações. Mas até agora, esses algoritmos foram relegados principalmente ao mundo digital, e não ao mundo físico tridimensional em que vivemos. Na verdade, ao tentar aplicar esses modelos ao mundo real, até mesmo os algoritmos mais sofisticados têm dificuldade para funcionar adequadamente. —Por exemplo, considere como é difícil desenvolver carros autônomos seguros e confiáveis. Esses modelos possuem inteligência artificial, mas simplesmente não entendem de física e muitas vezes têm alucinações e cometem erros inexplicáveis.
No entanto, este ano é o ano em que a IA finalmente dará o salto do mundo digital para o mundo real em que vivemos. Estender a IA para além das fronteiras digitais exige reimaginar a forma como as máquinas pensam e combinar a inteligência digital da IA com as capacidades mecânicas da robótica. Isto é o que chamo de “inteligência física”, uma nova forma de máquinas inteligentes que podem compreender ambientes dinâmicos, lidar com a imprevisibilidade e tomar decisões em tempo real. Ao contrário dos modelos usados na IA padrão, a inteligência física está enraizada na física. Na compreensão dos princípios fundamentais do mundo real, como causa e efeito.
Tais recursos permitem que modelos de inteligência física interajam e se adaptem a diferentes ambientes. Meu grupo de pesquisa no MIT está desenvolvendo um modelo de inteligência física denominado rede líquida. Por exemplo, em um experimento, os dados capturados por um piloto humano foram usados para treinar dois drones, um operado com um modelo padrão de IA e outro com uma rede líquida, ao longo de um verão. Localizamos o objeto na floresta. . Ambos os drones tiveram um desempenho igualmente bom quando foram encarregados de fazer exatamente o que foram treinados para fazer, mas ambos os drones tiveram um desempenho igualmente bom quando solicitados a localizar objetos em diversas situações, inclusive durante o inverno e em ambientes urbanos. Nesse caso, apenas a Rede Líquida. drone completou com sucesso sua missão. Esta experiência mostrou que, ao contrário dos sistemas tradicionais de IA, que param de evoluir após uma fase inicial de treino, as redes líquidas continuam a aprender e a adaptar-se a partir da experiência, tal como os humanos.
A inteligência física também pode interpretar e executar fisicamente comandos complexos derivados de texto e imagens, preenchendo a lacuna entre as instruções digitais e a execução no mundo real. Por exemplo, em meu laboratório, podemos projetar e imprimir iterativamente pequenos robôs em 3D com base em instruções como “um robô que pode andar para frente” ou “um robô que pode pegar coisas” e sistemas fisicamente inteligentes que podem ser impressos em menos de um minuto. Objeto”.
Outros laboratórios também estão fazendo grandes progressos. Por exemplo, a Covariant, uma startup de robótica fundada pelo pesquisador da UC Berkeley, Pieter Abbeel, está desenvolvendo um chatbot (semelhante ao ChatGTP) que pode controlar um braço robótico com base em comandos. Eles já garantiram mais de US$ 222 milhões para desenvolver e implantar robôs de classificação em armazéns em todo o mundo. Uma equipe da Universidade Carnegie Mellon demonstrou recentemente como um robô com uma única câmera e atuação imprecisa poderia saltar sobre obstáculos com o dobro de sua altura usando uma única rede neural treinada por reforço, demonstrando a capacidade de realizar movimentos de parkour dinâmicos e complexos, como cruzar lacunas. o dobro do seu comprimento. aprender.
Se 2023 foi o ano da conversão de texto em imagem e 2024 foi o ano da conversão de texto em vídeo, 2025 será o ano de uma nova geração de dispositivos, de robôs a redes elétricas e casas inteligentes. era da inteligência física. – que podem interpretar o que lhes dizemos e realizar tarefas no mundo real.