当人类伸手去抓住某个特定物体时,他们经常需要将杂物推开以隔离它,并确保有足够的空间来拾取它。即使人类并不总是完全意识到他们正在做什么,这种被称为“预先掌握”的策略可以让他们更有效地掌握物体。
近年来,一些研究人员试图在机器人中重现人类操纵策略,但较少研究侧重于预先掌握。考虑到这一点,卡尔斯鲁厄理工学院(KIT)的一个研究小组最近开发了一种算法,可以用来训练机器人在掌握之前掌握和操纵策略。这种新方法是在arXiv发表的一篇论文中提出的。虽然掌握是机器人技术中众所周知的任务,但是预处理操作仍然非常具有挑战性,这使得机器人难以从杂乱或狭窄的空间中抓取物体。然而,随着机器和机器人学习的最新创新,机器人可以学习如何通过与环境交互来解决各种任务。我们想要应用我们以前工作中提出的方法,不仅要掌握,还要提前掌握操作。
当机器人学会如何完成任务时,它基本上需要弄清楚如何通过最大化其奖励来解决问题。在他们的研究中,研究人员专注于从随机填充的垃圾箱中抓取物体的任务。使用来自摄像机的输入和来自其固定装置的反馈,机器人被训练了大约80小时。当它成功地抓住机器人抓握中的物体时,它可以用于预先掌握操作策略,例如位移或推进。
这听起来很简单,但实施起来可能很棘手:例如,您如何定义预抓取操作的质量?研究人员提出了一种基于先前研究的方法,该方法研究了在特定动作之前和之后使用抓取概率的差异,重点关注动作所在的小区域。在他们的新研究中,Berscheid和他的同事们也试图找出机器人应该尽快学习。