Universidades ajudando robôs a aprender movimentos humanos

Carnegie Mellon e Stanford desenvolveram o ASAP, estrutura inovadora que está redefinindo como robôs humanóides aprendem.
Robôs dançando com camisas de basquete. Robôs dançando com camisas de basquete.

Imagine que você tem um robô que quer aprender a se movimentar melhor, como um ser humano de verdade. Provavelmente ele faria isso do mesmo jeito que os novos humanos (os bebês e crianças) fazem: imitando humanos adultos.

No mundo da robótica, essa “imitação” é facilitada através de uma ajuda virtual, que são basicamente video games que servem como simuladores. Mas aí vem um novo obstáculo, porque botar a teoria na prática ainda é o maior desafio. É o descompasso entre as simulações e a realidade.

É como se você aprendesse a andar de bicicleta em um video-game e depois fosse tentar na vida real.

Enfim, os robôs humanóides (aqueles que tem a forma humana, com cabeça tronco e membros, etc) são mais ou menos a interseção entre um chatGPT e um humano.

Pensando nisso alguns pesquisadores das universidades Carnegie Mellon e Stanford desenvolveram o ASAP, uma estrutura inovadora que está redefinindo como robôs humanóides aprendem habilidades ágeis ao alinhar simulações com a física do mundo real.

Funcionamento e Impacto

A estrutura do ASAP funciona em duas etapas. Primeiramente, movimentos são pré-treinados em simulação usando dados de movimentos humanos.

E que humanos! Cristiano Ronaldo, Kobe Bryant, LeBron James, entre outros. Afinal, se é para imitar, que imitem os melhores. Imagine isso daqui poucas décadas, a velocidade com que vão aprender com nossos melhores humanos.

Em seguida, um modelo de ação delta é treinado para ajustar as discrepâncias quando esses movimentos são aplicados no mundo real. Isso permite que robôs, como o Unitree G1, realizem movimentos anteriormente inexequíveis, melhorando a agilidade e a coordenação geral.

Método

  1. Pré-treinamento de rastreamento de movimento e coleta de trajetória real:
    com os movimentos humanoides redirecionados de vídeos humanos, pré-treinamos várias políticas de rastreamento de movimento para implementar trajetórias do mundo real;
  2. Treinamento
    do modelo de ação delta Com base nos dados de implementação do mundo real, treinamos o modelo de ação delta minimizando a discrepância entre o estado de simulação e o estado do mundo real s_ts^r_t;
  3. Política Ajuste
    fino Congelamos o modelo de ação delta, incorporamo-lo ao simulador para alinhar a física do mundo real e, em seguida, ajustamos a política de rastreamento de movimento pré-treinada;
  4. Implantação
    no mundo real Por fim, implantamos a política ajustada diretamente no mundo real sem o modelo de ação delta.

clique na imagem para ampliar

Fluxo de treinamento de simulação de movimento humano.

Um Salto para o Futuro

Os testes realizados demonstraram que o ASAP não só reduz o erro de rastreamento, mas também aumenta significativamente a agilidade dos robôs. Isso sugere um futuro brilhante para aplicações diversas, desde a automação industrial até auxílio em fisioterapia.

Promessa de Avanços Futurísticos

Com a capacidade de alinhar simulação e realidade, o ASAP pode abrir portas para robôs que rivalizam com habilidades humanas em ambientes controlados e imprevisíveis. A inovação não só promete transformar a indústria de robótica, mas também potencializar a aplicação de robôs em várias indústrias e serviços pessoais.

Publicidade