Manufaturação industrial
Internet das coisas industrial | Materiais industriais | Manutenção e reparo de equipamentos | Programação industrial |
home  MfgRobots >> Manufaturação industrial >  >> Manufacturing Technology >> Sistema de controle de automação

Métodos de treinamento de cães ensinam robôs a aprender novos truques


Com uma técnica de treinamento comumente usada para ensinar cães a sentar e ficar, cientistas da computação mostraram a um robô como aprender vários novos truques, incluindo empilhar blocos. Com o método, o robô (chamado Spot) conseguiu aprender em dias o que normalmente leva um mês. Ao usar o reforço positivo – uma abordagem familiar para qualquer pessoa que tenha usado petiscos para mudar o comportamento de um cão – a equipe melhorou drasticamente as habilidades do robô e fez isso com rapidez suficiente para tornar o treinamento de robôs para o trabalho no mundo real uma empresa mais viável.

Ao contrário de humanos e animais que nascem com cérebros altamente intuitivos, os computadores são lousas em branco e devem aprender tudo do zero. Mas o verdadeiro aprendizado geralmente é realizado com tentativa e erro, e os roboticistas ainda estão descobrindo como os robôs podem aprender de forma eficiente com seus erros. A equipe conseguiu isso criando um sistema de recompensas que funciona para um robô da mesma forma que as guloseimas funcionam para um cachorro. Onde um cachorro pode receber um biscoito por um trabalho bem feito, o robô ganhou pontos numéricos.

Para empilhar blocos, Spot o robô precisava aprender a se concentrar em ações construtivas. À medida que o robô explorava os blocos, ele rapidamente aprendeu que comportamentos corretos para empilhar ganhavam pontos altos, mas os incorretos não ganhavam nada. Spot ganhou mais ao colocar o último bloco no topo de uma pilha de quatro blocos.

A tática de treinamento não apenas funcionou, mas também levou apenas alguns dias para ensinar ao robô o que costumava levar semanas. A equipe conseguiu reduzir o tempo de prática treinando primeiro um robô simulado, que é muito parecido com um videogame, e depois fazendo testes com o Spot. O robô aprende rapidamente o comportamento correto para obter a melhor recompensa. Na verdade, o que costumava levar um mês de prática para o robô atingir 100% de precisão foi feito em dois dias.

O reforço positivo não só funcionou para ajudar o robô a aprender a empilhar blocos, mas também com o sistema de pontos, o robô aprendeu rapidamente várias outras tarefas – até mesmo como jogar um jogo de navegação simulado. A capacidade de aprender com os erros em todos os tipos de situações é fundamental para projetar um robô que possa se adaptar a novos ambientes.

A equipe imagina que essas descobertas podem ajudar a treinar robôs domésticos para lavar roupa e lavar pratos – tarefas que podem ajudar os idosos a viver de forma independente. Também poderia ajudar a projetar carros autônomos aprimorados ou realizar a montagem de produtos.

Para mais informações, contate Jill Rosen em Este endereço de e-mail está protegido contra spambots. Você precisa habilitar o JavaScript para visualizá-lo.; 443-547-8805.

Sistema de controle de automação

  1. Moldagem por injeção:Novos robôs em Fakuma
  2. Novos robôs:econômicos e topo de linha
  3. Robôs na NPE:mais rápidos, mais fortes, mais inteligentes
  4. Mantendo os robôs ocupados
  5. Moldagem por Injeção:Novos Robôs na K 2019
  6. Automação:Novo Hardware e Software para Robôs de Baixo Custo
  7. Robô universal recebe novo presidente
  8. Moldagem por Injeção:Novos Robôs e Portal do Cliente para Monitoramento e Assistência Remota
  9. Desenvolvedores da Kiva Systems lançam nova empresa e seu próprio robô de logística
  10. Omron lança novo software para seus robôs móveis